赛后以前的href我有一个不formmated的html文件,我需要得到HREF链接,这只是在比赛前...我的HTML文件看起来像:获取用grep,awk或者sed
<a href="url1.com">Bla Bla Bla [Test1]</a><a href="url2.com">Bla Bla Bla [Test2]</a><a href="url3.com">Bla Bla Bla [Test3]</a>
所以现在我需要在[Test2]模式之前获得href内容,并且预期的回报是url2.com。
我不是一个sed或awk专家,我不认为这是可能的纯粹的grep命令。
我可以使用下面的命令知道我的部分是否存在于文件内部,但我不知道如何获得以前的href。
grep -o '\[S06E04\]' file.html
我真的很感激任何帮助。
感谢
通常,这不是一个好主意,以处理未行分隔的数据,如XML,这些工具需要以行分隔的数据。改为使用'xmlstarlet'之类的东西。 –
@MichaelVehrs:这个html好像被缩小了... – Jahid