我试图在我的apache访问日志中找到任何空白的用户代理和欺骗用户代理的痕迹。在访问日志中查找空白的用户代理和欺骗UA
下面是从我的访问日志的典型线路:(IP和域名节录)
x.x.x.x - - [10/Nov/2012:16:48:38 -0500] "GET /YLHicons/reverbnation50.png HTTP/1.1" 304 - "http://www.example.com/newaddtwitter.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/534.7 ZemanaAID/FFFF0077"
为空的用户代理我试图做到这一点:
awk -F\" '($6 ~ /^-?$/)' /www/logs/www.example.com-access.log | awk '{print $1}' | sort | uniq
为了找到有关信息UA的我运行此:(给我的每一个独特的UA具有点击量)
awk -F\" '{print $6}' /www/logs/www.example.com-access.log | sort | uniq -c | sort -fr
我能做些什么不同到m让这些命令更强大,更深思熟虑,同时给我提供最好的信息来打击互联网上的机器人和其他渣滓?
对不起,迟到了,但这很酷。绝对得到书签以供将来使用。谢谢! –