解析我想分析其中包含类似以下行的日志文件(log.txt的):简单的正则表达式在bash
2010-10-19 07:56:14 URL:http://www.website.com/page.php?ID=26 [13676] -> "www.website.com/page.php?ID=26" [1]
2010-10-19 07:56:14 URL:http://www.website.com/page.php?ID=44 [14152] -> "www.website.com/page.php?ID=44" [1]
2010-10-19 07:56:14 URL:http://www.website.com/page.php?ID=13 [13681] -> "www.website.com/page.php?ID=13" [1]
2010-10-19 07:56:14 ERROR:Something bad happened
2010-10-19 07:56:14 ERROR:Something really bad happened
2010-10-19 07:56:15 URL:http://www.website.com/page.php?ID=14 [12627] -> "www.website.com/page.php?ID=14" [1]
2010-10-19 07:56:14 ERROR:Page not found
2010-10-19 07:56:15 URL:http://www.website.com/page.php?ID=29 [13694] -> "www.website.com/page.php?ID=29" [1]
正如你可能已经猜到了:
1)我需要从每一行中提取该部分:
2010-10-19 07:56:15 URL:http://www.website.com/page.php?ID=29 [13694] -> "www.website.com/page.php?ID=29" [1]
------------------------^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
2)该部分转到另一个文件(log.html)所示:
<a href="http://www.website.com/page.php?ID=29">http://www.website.com/page.php?ID=29</a>
我需要通过bash脚本来执行此操作,该脚本将在* nix平台上运行。我不知道shell编程如此详细的脚本将会非常感谢,指向bash编程参考的指针会做。
猛砸没有做正则表达式。使用grep找到匹配的行,然后awk提取相关的位。 – 2010-10-19 12:14:47