2013-07-16 72 views
2

我想比较Html文档天气有相同的标签具有相同的安排,无论不同的内部文本和属性值是不同的。我只想比较一般的标签结构。如html文档比较

<html> 
<head> 
</head> 
<body> 
<span class="my paragraph">comparison of general tag structure of html</span> 
</body> 
</html> 

<html> 
<head> 
</head> 
<body> 
<span class="Mega Offer">free membership offer</span> 
</body> 
</html> 

相同

<html> 
<head><title>Different</title> 
</head> 
<body> 
<span class="my paragraph">comparison of general tag structure of html</span> 
</body> 
</html> 

不一样的,因为没有在标签HTML结构中的一个额外的标题标签,无论内在价值的属性值相同。

+0

你只想知道他们是不同的还是你也想知道其中的区别?我认为在这两种情况下将html文档解析为XML都会有所帮助。 –

+0

是的,我也想知道区别。 –

+0

输出应该有什么区别? –

回答

0

如果你愿意使用PHP,有几个功能,如preg_match,将寻找模式。您可以使用file将html文件读取到数组中,每个新行都是数组中的另一个条目。然后对其他html文件执行相同的操作。然后,您可以搜索第一个标签(又名:以<开头的内容)并读取该行的其余部分,直到>。然后去搜索另一个html文件中的相同标签,计算该标签出现的次数。冲洗并重复。