我试图解析通过html源代码。在我的例子中,我只是在回应它。但是,我正在练习中从文件中读取html。字段分隔符 - 麻烦分隔命令字符
下面是一些代码,工程,语法:
echo "<td>Here</td> some dynamic text to ignore <garbage> is a string</table>more junk" |
awk -v FS="(<td>|</td>|<garbage>|</table>)" '{print $2, $4}'
在FS声明
我创建4个分隔符,其做工精细,和我输出2和第4场。
然而,第三场定界符我真正需要使用包含awk命令字,从字面上:
')">
,这样当我改变上述声明:
echo "<td>Here</td> some dynamic text to ignore ')\"> is a string</table>more junk" |
awk -v FS="(<td>|</td>|')\">|</table>)" '{print $2, $4}'
我试着将冒犯的字符串与\字符的一个,全部和每个组合进行转义。但是,没有任何工作。
命令的预期输出不起作用是什么? –
@Ed Morton的第一位代码返回预期的输出。第二个不是。已经将您的其他答复标记为解决方案。谢谢。 – James
确定,但下次 - 实际显示您的问题的预期输出。 –