2012-01-17 46 views
0

我想使一个新闻网站从其他新闻网站获取其内容, 打开rss饲料和feach url并打开页面的html dom然后 只获得文本新闻 我想我必须使用PHP的DOMDocument类?我怎样才能得到部分网页由php

<?php 
$doc = new DOMDocument(); 
$doc->loadHTML("<html><body>Test<br></body></html>"); 
echo $doc->saveHTML(); 
?> 

http://www.php.net/manual/en/class.domdocument.php

+0

以下RSS提要中的链接可获取完整文章,然后重新发布?您在那里侵犯版权。我建议退后。 – Quentin 2012-01-17 14:05:58

+1

这是严格禁止的,可能会导致很多法律问题,所以要小心。 如果你还想继续看看:SimpleXML和XPath – stefandoorn 2012-01-17 14:09:03

+0

除了盗取上面提到的其他人的内容,如果你这样做每当用户请求你的网页,你的网站会感觉非常缓慢。 – dm03514 2012-01-17 14:13:12

回答

1

RSS提要是XML。要获得链接,我会使用simpleXML。要加载页面,您可以使用cURLHttpRequest

要分析返回的代码,我也会使用DOMDocument!或者,您可以使用simpleHtmlDom