2013-04-08 23 views
0

我想知道建议的方式从XML注定的PHP字符串去除换行符。使用下面的方法,我在我的XML标签之间留下了2到4个空格。剥离线断XML之前留下空格 - 什么是正确的方法?

$current = $xml->saveXML(); 
$current = str_replace(array("\r\n", "\r", "\n"), "", $current); 

删除换行符的正确语法是什么,所以XML标签显示为端到端,没有在它们之间添加空格?

+0

如果你问相同的http://stackoverflow.com/questions/5258543/remove-all-the-line-breaks-from-the-html-source – 2013-04-08 06:38:36

回答

1

首先一些基本的东西:$xml->saveXML()建议您使用SimpleXML。它只在输出中使用一个分隔符:"\n"

因此寻找"\r\n""\r"是错误的。同样使用str_replace()是不是一个好主意,你应该使用strtr()代替:

$current = strtr($current, array("\n" => '')); 

由于这替换XML元素之间的换行符空格字符不会被删除或改变了这里。

但是,这些空格字符很大程度上取决于您的输入XML。在XML中,你可以有重要的意义(删除它将失败)和非重要的空白(保存删除),但SimplexmlDOMDocument不知道哪一个是哪一个。

由于图书馆本身不知道,所以你需要告诉他们。例如,它看起来像是在寻找所有文本节点的修剪。由于SimpleXMLElement确实不是允许访问文本节点,所以需要使用DOMXPath。但没有恐惧,这并不复杂:

$doc = dom_import_simplexml($xml)->ownerDocument; 
$xpath = new DOMXPath($doc); 
foreach ($xpath->query('//text()') as $text) { 
    $text->data = trim($text->data); 
} 

这只是在文档顺序迭代所有文本节点和修剪它们。

然后,您只需要获取以文档元素开头的XML。这将去掉XML声明和任何前述注释和处理指令(我假设你想要的):

$current = $doc->saveXML($doc->documentElement); 

万一不行,从上面的行分隔符规则。你可以改为:

$current = $xml->saveXML(); 
$current = strtr($current, array("\n" => '')); 

就是这样。我希望这是有帮助的。

相关问题