2012-12-30 100 views
3

我使用下面的代码从指定的页面得到全HTML卷曲页面标题

$url = "http://www.google.com"; 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
$result = curl_exec($ch); 
curl_close ($ch); 

问:怎么能这样的代码进行修改,以回报<title>,而不是完整的HTML的页面。 $结果存储结果。

+0

如果您阅读Google URL,您将获得该页面的完整HTML,并且可能还包含很多JavaScript内容。 Ryan Naddy的正则表达式对我来说看起来很正确。 –

回答

7

您可以使用正则表达式拿到冠军,我觉得这是正则表达式非常有用:

function get_html_title($html){ 
    preg_match("/\<title.*\>(.*)\<\/title\>/isU", $html, $matches); 
    return $matches[1]; 
} 
-1

看看解析结果的内容

或者使用正则表达式

或DOM文档

4

你不能真的只是得到标题,你可以得到整个文件,然后剔除你需要的元素:我喜欢用Simple Html Dom Parser

$html = file_get_html('http://www.google.com/'); 
$title = $html->find('title');