2011-07-12 65 views
1

i)我需要使用php从html页面中提取几个元素。PHP Html Dom/Parser

ii)使用html dom解析器。

ⅲ)我已经能够提取所有**<a>**s, **<b>**s, **<li>**s

ⅳ)应该如何能够提取使用HREF类型/内

**<td class = ""><a href = "">ABC</a></td>** 

任何封闭的元素,即HREF

注属性:我需要提取ABC

回答

0

这可能不是您正在寻找的答案,但是,我以前使用过phpquery,并发现它是做这类工作的好工具。

http://code.google.com/p/phpquery/

+1

我很确定phpquery没有维护和越野车。我会用PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/ – Petah

0

使用DOM解析器你不会得到整个结构。

您应该为此使用getAttribute()方法。 Check here

下面是一个简单的例子也

$markup = file_get_contents($someplace); 
$dom = new DomDocument(); 
$dom -> loadHTML($markup); 
$tds = $dom -> getELementsByTagName("td"); 
foreach($tds as $td) { 
    echo $td -> getAttribute("class"); 
}