2012-11-01 52 views
1

可能重复:
innerHTML in PHP’s DomDocument?的DOMDocument节点获得HTML内容

我正在写一个应用程序从RSS源获取预览内容。 为此,我想获取特定div的HTML内容。

文本,我取这个样子的

<P>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Aenean egestas enim non tellus interdum mollis. Pellentesque accumsan, purus quis facilisis vulputate,</P> 
<P>leo enim rhoncus velit, non consectetur lacus libero a eros. Fusce rutrum, sapien eget facilisis placerat, metus enim sagittis ante, quis elementum velit tortor sit amet purus. </P> 
<P>Mauris accumsan, dolor quis mollis iaculis, metus nisl lacinia neque, vel condimentum erat nisl ut lorem. Cras vestibulum urna in nisl ullamcorper rhoncus tincidunt massa </P> 
<P>pretium. Nunc dui est, imperdiet et vulputate sit amet, facilisis semper ante. Duis ac ornare elit. Morbi gravida dolor vitae nunc tempus a hendrerit odio posuere. Morbi </p> 

但是,当我已经curld页面并解析它连接获得的nodeValue我得到的文本没有段落标记

$dom = new DOMDocument(); 
$dom->validateOnParse = false; 
$html = get_data($item['link']); 
$dom->loadHTML($html); 
$storycontents = $dom->getElementById('story-body-text'); 
echo '<TR><TD>'.$storycontents ->nodeValue.' </TD></TR>'; 

是否有在DOMDocument中获取特定ID的“innerHTML”属性?

+0

http://www.php.net/manual/en/class.domnode.php#domnode.props.textcontent应该为你工作 –

回答

3

由于@simone How to get innerHTML of DOMNode?

$tmp_dom = new DOMDocument(); 
$tmp_dom->appendChild($tmp_dom->importNode($child, true)); 
$innerHTML.=trim($tmp_dom->saveHTML()); 

在我的搜索没有露面,但谢谢你没有少。

+0

他说节点不是整个HTML内容 – machineaddict

+0

他是我?...和哇,这是旧的 – Tschallacka