2010-12-08 45 views
0

我使用这个PHP:PHP卷曲抢特定HTML

<?php 

$curl_handle=curl_init(); 
curl_setopt($curl_handle,CURLOPT_URL,'http://www.notrly.com/jackbauer/'); 
curl_setopt($curl_handle,CURLOPT_CONNECTTIMEOUT,2); 
curl_setopt($curl_handle,CURLOPT_RETURNTRANSFER,1); 
$buffer = curl_exec($curl_handle); 
curl_close($curl_handle); 

if (empty($buffer)) 
{ 
    print "Not today"; 
} 
else 
{ 
    print $buffer; 
} 
?> 

没有在,我要提取和显示源类“事实”的p标签!我该怎么做?如果我使用它来从他们的网站抓取其他人的HTML,那么它是否违反版权?

回答

2

如果你想使用卷曲,然后下载页面,并使用DOM解析器,如:

http://simplehtmldom.sourceforge.net/

或者你可以做这样的事情:

include_once('simple_html_dom.php'); 

$dom = file_get_html('http://www.notrly.com/jackbauer/'); 

foreach($dom->find("div.head div.fact p.fact") as $element) 
    die($element->innertext); 
+0

优秀的,再次,是对某种版权> – benhowdle89 2010-12-08 22:32:00

+0

从我所看到的,没有版权可见的页面上。所以我认为它是公开的。 – 2010-12-08 22:34:54

0

乘坐请看strpos查看字符串...

if (strpos($buffer, '<p class="fact">') !== FALSE) { 
    print "Yay"; 
} 
0

我会检查在这个question的答案中提到的HTML解析器。至于版权问题,我认为这将取决于许多因素,包括:

  • 你在与内容做
  • 多少内容您使用的是
  • 什么是网站你的著作权 正在刮