我试图在两个不同的中国购物网站的“产品页面”中提取主图像。PHP的Simple-HTML-DOM适用于一个URL,但不适用于其他
网站2产品页链接: http://detail.china.alibaba.com/offer/1235158006.html
我的代码工作蛮好的网站#1,但站点#2我得到一个奇怪的短html字符串。
这里是我的代码:
<?php
require_once('./includes/simple_html_dom/simple_html_dom.php');
$url="http://www.aliexpress.com/item/100FT-7-Core-Strand-550-Parachute-Cord-Nylon-Lanyard-Desert-Paracord-Survival-Kits-For-Climbing-Camping/541809415.html";
$html=file_get_html($url);
echo "html lenght : ".strlen($html)."<br>";
foreach($html->find('meta[property=og:image]') as $element) {
echo("result : ".$element->content);
}
echo "<br>-------------------------------------------------------------------<br>";
$url="http://detail.china.alibaba.com/offer/1235158006.html";
$html=file_get_html($url);
echo "html lenght : ".strlen($html)."<br>";
foreach($html->find('div[id=J_DetailInside]') as $element) {
echo("result : ".$element->innertext);
}
?>
我一直想任何事情来得到它正确,但没有成功而工作, 任何帮助将非常感谢!
有可能是第二个网站上的格式错误的HTML – 2013-05-08 07:24:15
谢谢你,你们都帮助过我。 – spelltox 2013-05-08 10:23:42