晓夏

北漂的女孩

Good Luck To You!

shell过滤egrep过滤多个关键词

浏览量:485

第一步:

    首先你先出出来要过滤的关键词,保存在一个txt文件里面,没一行都是一个要过虑的关键词,例如:

    QQ图片20160606164442.png

第二步:

    你需要过滤的词语,例如评论、昵称、帖子等等,也需要你先下载下来,每一行一行的处理,因为shell处理文件的速度远比处理数据库快的多,

所以你想快速完成数据,这是一个不错的方法,例如:

   QQ图片20160606164848.png

第三步:

    这些准备工作都做了好了,该写我们的程序了:

#!/bin/shell

#按照正则的方式去匹配例如:(武汉找小姐|求包养|单身汉)
while read line
do
    r="$r|$line"
done < badwords.txt

egrep -E "W号fH9813$r" note.txt >> youwenti.txt

在这里需要注意的是,badwords.txt坏词语里面,英文()、{}、\等等跟正则符号有冲突哦的都需要转义,否则你跑出来的数据绝对是有问题的,有可能它也不报错,但是结果不是你想要的。是不是很简单,本来需要php跑好天的数据,现在只需要1个小时,轻松搞定,希望能有帮助对你



神回复

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。