2014-02-10 27 views
3

在下面的代码中,我试图解析SVG文件并删除其中的所有文本节点。 但是,它不起作用(代码永远不会进入fornop for findnodes)。我究竟做错了什么?我尝试使用XPath和LibXML版本的代码,但没有一个能够工作。他们解析并转储文件,但findnodes不匹配。Perl XML/SVG解析器无法找到节点

#!/usr/bin/perl 

use strict; 
use warnings; 

use XML::XPath; 
use XML::XPath::XMLParser; 

my $num_args=$#ARGV+1; 
if($num_args != 1) { print "Usage: $0 <filename>\n"; exit(1); } 


my $file=$ARGV[0]; 


my $doc = XML::XPath->new(filename => $file); 

foreach my $dead ($doc->findnodes('/svg/text')) { 
    print "Found Text Node\n"; 
    $dead->unbindNode; 
} 

启动SVG文件的几行:

<svg 
    xmlns:dc="http://purl.org/dc/elements/1.1/" 
    xmlns:cc="http://creativecommons.org/ns#" 
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
    xmlns:svg="http://www.w3.org/2000/svg" 
    xmlns="http://www.w3.org/2000/svg" 
    xmlns:inkscape="http://www.inkscape.org/namespaces/inkscape" 
    version="1.1" 
    width="675" 
    height="832.5" 
    id="svg2" 
    xml:space="preserve"><metadata 
    id="metadata8"><rdf:RDF><cc:Work 
     rdf:about=""><dc:format>image/svg+xml</dc:format><dc:type 
      rdf:resource="http://purl.org/dc/dcmitype/StillImage" /></cc:Work></rdf:RDF></metadata><defs 
    id="defs6" /><g 
    transform="matrix(1.25,0,0,-1.25,0,832.5)" 
    id="g10"><path 
     d="m 54,608.663 450,0 M 54,129.052 l 450,0" 
     inkscape:connector-curvature="0" 
     id="path12" 
     style="fill:none;stroke:#231f20;stroke-width:0.5;stroke-linecap:butt;stroke-linejoin:miter;stroke-miterlimit:10;stroke-opacity:1;stroke-dasharray:none" /><text 
     transform="matrix(1,0,0,-1,229.0848,615.9133)" 
     id="text14"><tspan 

@

+0

您是否有输入文件的示例? – mirod

+0

,因为你的代码适用于我(当然,除了XML :: XPath中的未知'unbindNode'方法外),所以也许SVG不是你想象的那样。 – mirod

+0

你会介意给我们一个合适的输入文件吗?您在问题中包含的片段格式不正确,因此无法使用XML工具进行分析。谢谢。 – mirod

回答

4

/svg/text查找直接text元件svg根元素下。这不是你在这里。它看起来像你想要的text元素在文档中的任何地方,这将是//text。这应该适用于XML :: XPath。

如果您想使用XML :: LibXML,您应该使用XML :: LibXML,因为它比XML :: XPath更好(维护更好,效率更高,功能更强大),所以您必须注意命名空间:整个文档有一个默认名称空间(位于开始标记中的xmlns="http://www.w3.org/2000/svg"位)。您将需要声明它并使用XML :: LibXML :: XPathContext评估XPath表达式,包括前缀。:

#!/usr/bin/perl 

use strict; 
use warnings; 

use XML::LibXML; 
use XML::LibXML::XPathContext; 

# it's easier to test directly @ARGV in scalar context than to use $#ARGV 
if(@ARGV != 1) { print "Usage: $0 <filename>\n"; exit(1); } 

my $file=$ARGV[0]; 

my $doc = XML::LibXML->load_xml(location => $file); 

my $xpc = XML::LibXML::XPathContext->new($doc);  # create the XPath evaluator 
$xpc->registerNs(x => 'http://www.w3.org/2000/svg'); # declare the namespace as x 

# the query now uses x as the prefix for the svg namespace 
foreach my $dead ($xpc->findnodes('//x:text')) { 
    print "Found Text Node\n"; 
    $dead->unbindNode; 
} 
+0

谢谢,先生!对于解决方案和改进提示! – WorkWise

+0

没问题。命名空间在处理XML时通常很痛苦。它们在构建通用工具时非常有用,但对于大多数实际的XML消除方法,它们会阻碍并混淆事物。特别是默认的命名空间。 – mirod

+0

是的!这让我开始了他们,我一定会经常需要他们。 – WorkWise