我正在使用简单的HTML DOM解析器,并且我想完全忽略“嵌套”元素的内容并获取正在进行的“pre”元素的内容。简单的HTML DOM解析器 - 跳过某些元素
<div id=parent>
<div class="nested">
<pre>Text that I want ignored</pre>
</div>
<pre>
This is the text I want to access
</pre>
</div>
我没有HTML源代码的控制权,并且所有者最近添加了“嵌套”元素。在我访问我需要的内容之前:
$page_contents = file_get_html($url);
$div_content = $page_contents->find('div[id=parent]pre', 0)->innertext;
但显然新的嵌套元素已经破坏了我的方法。
我似乎无法找到任何有关这种情况下的官方文档。
好吧,更新我的答案,我可以。 – user 2011-04-08 13:38:19
你为什么不编写一个函数,在id为“parent”的div的子元素之间迭代并忽略那些不是pre的子元素?迭代虽然这些孩子将绕过“我想忽略的文本”,因为它不是母公司的孩子,虽然它们是间接相关的。 – PEdroArthur 2011-04-08 13:48:02