2017-08-30 37 views
-1

cat file | grep "<span class='s-name'>" | awk '/"<span class='s-name'>"/ && /</span>试图让之间的站点名称列表“的<span class =‘S-名’></span>

一些有关这似乎是错误的。我的意思是,比其他不工作。

我也希望把它变成我敢肯定一个文件就是“文件名”处结束。

+0

是否在您的文件中嵌套'span's? – dorukayhan

+0

是的,一行看起来像这样 '

Bob Lepine Vice President of Content, FamilyLife
' –

+0

我希望取消标题,所有我关心的是名称,除非我可以同时获得CSV格式。 –

回答

0

使用GNUgrep

输入

$ cat infile 
<div class='signer'> <span class='s-name'>Bob Lepine</span> <span class='s-title'>Vice President of Content, FamilyLife</span> </div> 

输出

$ grep -Po "(?<=<span class='s-name'>).*?(?=</span>)" infile 
Bob Lepine 

$ grep -Po "(?<=<span class='s-title'>).*?(?=</span>)" infile 
Vice President of Content, FamilyLife 
0

使用XML/HTML解析器被适当的方式来解析XML/HTML内容,xmlstarlet溶液:

xmlstarlet sel -t -v "//span[@class='s-name']" yourfile 

的输出:

Bob Lepine 
相关问题