我需要将网页中的所有HTML标签提取到数组中,而标签内没有数据。它看起来像...如何从网页中将所有HTML标签提取到数组中?
我使用PHP
Array
{
html =>
Array
{
head =>
Array
{
title,
meta name='description' content='bla bla'
meta name='keyword' content='bla bla'
....
},
body =>
Array
{
div id='header' =>
Array
{
div class='logo',
div class='nav'
},
div id='content' =>
Array
{
h1,
p class='first-para',
p,
p,
div id='ad'
},
div id='footer' =>
Array
{
ul =>
Array
{
li =>
Array
{
a href='link.htm'
},
li =>
Array
{
a href='link.htm'
},
li =>
Array
{
a href='link.htm'
}
}
}
}
}
}
[解析HTML的最佳方法]的可能的重复(http://stackoverflow.com/questions/3577641/best-methods-to-parse-html) – Gordon 2010-10-06 14:47:10