1
我想解析HTML页面Google play
并获取有关应用程序的一些信息。简单的html-dom完美的工作,但如果页面包含没有空格的代码,它完全ingnores属性。举例来说,我的html代码:Simple-html-d跳过属性
<div class="doc-banner-icon"><img itemprop="image"src="https://lh5.ggpht.com/iRd4LyD13y5hdAkpGRSb0PWwFrfU8qfswGNY2wWYw9z9hcyYfhU9uVbmhJ1uqU7vbfw=w124"/></div>
正如你所看到的,有没有image
和src
之间的任何空间,所以简单的HTML DOM忽略src
属性,只返回<img itemprop="image">
。如果我增加空间,它完美的作品。为了得到这个属性我使用下面的代码:
foreach($html->find('div.doc-banner-icon') as $e){
foreach($e->find('img') as $i){
$bannerIcon = $i->src;
}
}
我的问题是如何改变这个美丽库得到这个div
的全内的文字?
您可以使用[PHP的DOMDocument](http://php.net/manual/en/class.domdocument.php)而不是简单的HTML Dom解析器。否则,只需在http://codepad.org/HdUQKx3l查看此代码片段,只需通过DOMDocument加载并保存HTML即可在Simple HTML Dom Parser上添加所需的空格。 –