我试图使用XML :: SAX修改XHTML文档的某些部分,但是所有尝试都失败了。使用Perl XML :: SAX修改XML文档
这里是我想要做的事:
#!/usr/bin/perl
package MyHandler;
use strict;
use warnings;
use base qw(XML::SAX::Base);
use Data::Dumper;
sub start_element {
my $self = shift;
my $data = shift;
if($data->{LocalName} eq 'span') {
$data->{LocalName} = 'naps';
}
$self->SUPER::start_element($data); # GOOD (and easy) !
#print Dumper($data);
}
1;
#============================
#Main programm
#============================
use strict;
use warnings;
use XML::SAX::ParserFactory;
use XML::SAX::Writer;
my $out;
my $o = XML::SAX::Writer->new(Output => \$out);
my $h = MyHandler->new(Handler => $o);
my $p = XML::SAX::ParserFactory->parser(Handler => $h);
my $data;
{ local undef $/ }; $data = <DATA>;
$p->parse_string($data);
print $out;
__DATA__
<?xml version="1.0" encoding="UTF-8"?>
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:wicket="http://wicket.apache.org/dtds.data/wicket-xhtml1.4-strict.dtd">
<body>
<wicket:panel>
<form wicket:id="mvpForm">
<span>Edit Information: </span>
<input type="checkbox" wicket:id="editForm"/>
<span>Name: </span>
<span wicket:id="name"></span>
<input type="text" wicket:id="nameEdit"/>
<span>Last Name: </span>
<span wicket:id="lastName"></span>
<input type="text" wicket:id="lastNameEdit"/>
<span>DOB: </span>
<span wicket:id="dob"></span>
<input type="text" wicket:id="dobEdit"/>
<span>Occupation: </span>
<span wicket:id="occupation"></span>
<input type="text" wicket:id="occupationEdit"/>
<span>Gender: </span>
<span wicket:id="gender"></span>
<span wicket:id="genderEdit"/>
<input type="submit" wicket:id="submit"/>
</form>
</wicket:panel>
</body>
</html>
的基本思想是每一个“跨度”更改为“小睡”,写所产生的修改后的XML到stdout。另外,看看它是否可以使用SAX合并xml块,换句话说,如果我找到了一个扩展到其他东西的特定元素,我怎样才能将它与输出合并到一起STDOUT?
E.g. 来源:
<xmltag>
<expandable/>
</xmltag>
要:
<xmltag>
<expanded>
This is an expanded element
</expanded>
</xmltag>
感谢。
有关添加文本节点是什么? – daxim 2012-04-20 07:16:08
我不认为SAX支持添加节点。可能使用肮脏的方式! – tuxuday 2012-04-20 07:34:33
谢谢,那是一个有点意外的寿:)。是的,看起来最好的方法是在找到可扩展节点时创建另一个sax解析器,但是如何将它与主处理管道合并?我会再试验一下,可能毕竟有一个解决方案。 – dryajov 2012-04-20 16:47:10