2014-04-07 41 views
1

我正在使用SimpleHTMLDOM并尝试从网站获取一些内容。我必须说,我很高兴使用SimpleHTMLDOM,但我无法找到任何关于我的问题以及如何解决它的问题。SimpleHTMLDOM - 排除div内的元素

这样下去: 我试图从后续元素中提取字符串:foo。

这是网站上元素FOO标记:

<div class="foo"> 
    Lorem Ipsum 
    <div class="bar"></div> 
</div> 

而我使用的PHP代码是这样的:

foreach($html->find('.foo ') as $m) 
     $foo = $m->innertext; 

这将输出:

Lorem Ipsum <div class="bar"></div> 

所以我的问题是如何排除类foo中的div /元素?

在此先感谢!

+0

哪里'with'从何而来?我猜这是在'div.bar'里面...请更正你的问题,请... – Enissay

+0

Woops,现在没有注意到。但我更新了我的问题,它应该是'Lorem Ipsum与

' –

回答

1

我认为你可以找到类似以下内容的第一个文本节点...

foreach($html->find('.foo') as $foo) 
    echo $foo->find('text', 0); 
+0

非常感谢你! :) –

+1

不是一个问题 - 它值得研究[* php:dom *](http://www.php.net/manual/en/book.dom.php),但如果你正在做大规模的事情因为它速度更快。 – Emissary

+0

啊,真好!谢谢你的提示。 –