抓取TEXT块中的特定行

我有一个大的TEXT（XML？）转储，我只想拿出包含我的内容的行。抓取TEXT块中的特定行

例如，我希望'TEXT HERE'部分被刷掉或什么东西。有没有一种方法可以在整个文件中查找这些内容，以便获取“内容”标签的所有“值”？

<mtg:Property displayName="Content" hidden="false" name="content" nullable="true" 
readonly="false" type="string"> 
       <mtg:Value>TEXT HERE</mtg:Value> 
</mtg:Property>

感谢您的任何帮助。

来源

2013-05-09 Tim Edwards

检查：http://www.w3.org/TR/xpath /＃location-paths – Madthew 2013-05-09 12:01:27

不要使用正则表达式解析XML。有用于制作XPath查询的命令行工具，它们会更好地工作。另外，什么是所有的报价？它看起来不是有效的XML – 2013-05-09 12:09:07

你确定你的文件不是有效的XML吗？然后请更新问题。在任何情况下，如果您在行首添加四个空格，markdown解析器将不会触及您的文件示例。使用[编辑]链接根据需要更新问题。我将它编辑成有效的XML – 2013-05-09 12:27:53

awk '/content/ {print $2}' FS='<mtg:Value>' RS='</mtg:Value>'

集合记录分离到</mtg:Value>
设置字段分隔符<mtg:Value>
含content和打印领域的查找记录2

来源

2013-05-09 15:56:53

抓取TEXT块中的特定行

回答

相关问题