我想抓住的名字和从advisor.travel网站上哪些内容的地方坐标为CC,所以我只需要前10个页面的名称和坐标...使用XPath抓取文本内容
链接到景点链接格式:http://en.advisor.travel/poi/1
所以'http://en.advisor.travel/poi/'.i
其中i
是吸引数
我想只有前10的吸引力,所以我是beetween 1个10和XPath的名字是
//h1 tag
和XPath的坐标是:
//span[@class='latitude']
//span[@class='longitude']
我现在创建一个刮刀和代码是:
<?php
for ($i=0; $i<=10; $i++)
{
$dom2 = new DOMDocument();
@$dom2->loadHTMLFile('http://en.advisor.travel' . $i);
$xpath2 = new DOMXPath($dom2);
$data = array();
$data[name] = $xpath2->query("//h1");
$data[latitude] = $xpath2->query("//span[@class='latitude']");
$data[longitude] = $xpath2->query("//span[@class='longitude']");
}
echo '<pre>' . print_r($data, true) . '</pre>';
?>
但这种代码的结果让我只有这个:
Array
(
[name] => DOMNodeList Object
(
[length] => 0
)
[latitude] => DOMNodeList Object
(
[length] => 0
)
[longitude] => DOMNodeList Object
(
[length] => 0
)
)
那么,如何解决这个问题?这里有什么问题?
再次是一样的... –