2013-04-04 63 views
-1

我在XML文件的内容:如何删除文本内容中的固定XML标签?

Hello 
<Images> 
<URL>google</URL> 
</Images> 
<Reviews> 
Good 
</Reviews> 
everybody, 

<Images> 
<URL>bing</URL> 
</Images> 
<Reviews> 
Good 
</Reviews> 
I am Nguyen 

输出:

Hello everybody, I am Nguyen 

如何删除<Images></Reviews>之间的内容。

上面的示例数据很小。其实,我有一个大数据。

+0

正如前面所说[在此之前](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454),您应该_not_尝试使用正则表达式解析XML或HTML。你会惨败的。相反,使用XML解析器。 – 2013-04-04 16:09:51

+0

@RobI你说错了,不是'你会失败',而是'你可能会失败';)如果内容足够静态,你可以使用正则表达式。我曾经在一些数据文件中做过。但是,当然你必须确定你正在使用的内容。 – 2013-04-04 16:11:31

回答

1

您可以用一个空格替换(?:\s*<(Images|Reviews)>.+?</\1>\s*)+。如果您使用的正则表达式不支持点全部(代表全部个字符的点(包括换行符)),则必须使其更复杂一点:​​适用于JavaScript。

+0

非常感谢!太好了!有用 ! :d – 2013-04-05 01:07:06

相关问题