0
我有一个mysql数据库,带有一个表: url |也就是说Bash脚本循环通过MySQL行并使用curl和grep
而像DATAS,例如:
------Column URL------- -------Column Words------
www.firstwebsite.com | hello, hi
www.secondwebsite.com | someword, someotherword
我要来遍历表来检查词存在于URL所指定的网站的内容。
我有这样的事情:
!/bin/bash
mysql --user=USERNAME --password=PASSWORD DATABASE --skip-column-names -e "SELECT url, keyword FROM things" | while read url keyword; do
content=$(curl -sL $url)
echo $content | egrep -q $keyword
status=$?
if test $status -eq 0 ; then
# Found...
else
# Not found...
fi
done
一个问题:
这是非常缓慢:如何设置卷曲优化每个网页的加载时间,不加载图片,这样的事情?
此外,将这样的东西放在shell脚本中,还是创建一个php脚本并使用curl调用它是个好主意?
谢谢!
为什么!?你为什么在bash中过滤?为什么不只是'选择...'这样的关键字像'%$ keyword%''? –
我必须得到网站内容。然后在其中搜索关键字,那怎么用sql请求呢? – user2178964
例如:我得到url = www.somesite.com,关键字= ok。 curl获取网站的内容,然后我去检查关键字是否在其中。 – user2178964