2013-05-09 21 views
0

我有一个大的TEXT(XML?)转储,我只想拿出包含我的内容的行。抓取TEXT块中的特定行

例如,我希望'TEXT HERE'部分被刷掉或什么东西。有没有一种方法可以在整个文件中查找这些内容,以便获取“内容”标签的所有“值”?

<mtg:Property displayName="Content" hidden="false" name="content" nullable="true" 
readonly="false" type="string"> 
       <mtg:Value>TEXT HERE</mtg:Value> 
</mtg:Property> 

感谢您的任何帮助。

+0

检查:http://www.w3.org/TR/xpath /#location-paths – Madthew 2013-05-09 12:01:27

+0

不要使用正则表达式解析XML。有用于制作XPath查询的命令行工具,它们会更好地工作。另外,什么是所有的报价?它看起来不是有效的XML – 2013-05-09 12:09:07

+0

你确定你的文件不是有效的XML吗?然后请更新问题。在任何情况下,如果您在行首添加四个空格,markdown解析器将不会触及您的文件示例。使用[编辑]链接根据需要更新问题。我将它编辑成有效的XML – 2013-05-09 12:27:53

回答

0
awk '/content/ {print $2}' FS='<mtg:Value>' RS='</mtg:Value>' 
  • 集合记录分离到</mtg:Value>
  • 设置字段分隔符<mtg:Value>
  • content和打印领域的查找记录2