2012-07-16 124 views
0

我需要解析一个巨大的网页...有一些像这样的字符串:shell脚本字符串替换在大文件

<li class="specialclass"><a href="http://some.changingurl.com" ..(some changing classes)..> 

我需要以上更改为:

<li class="specialclass">http://some.changingurl.com<a href="http://some.changingurl.com" ..(some changing classes)..> 

再后来我可以删除所有的html标签,但保持url的保存。只有url正在改变。

请帮我写一个子帖子。

谢谢。

+2

[你有什么试过?](http://mattgemmell.com/2008/12/08/what-have-you-tried/) – 2012-07-16 21:42:00

+0

其实我卡住了,不知道从哪里开始。 ty – 2012-07-16 21:42:39

+0

您可以在Linux中使用shell命令'sed'。让它做一个正则表达式查找和替换来修改文件到你喜欢 – Tucker 2012-07-16 21:54:56

回答