可能重复:
Best methods to parse HTML with PHP从PHP中提取HTML中的所有文本和img标签。
对于一个项目,我需要采取一个HTML页面,并从中提取它的所有文字和IMG标签,并保存在它们出现的顺序相同在网页中。
因此,举例来说,如果网页是:
<p>Hi</p>
<a href ="test.com" alt="a link"> text link</a>
<img src="test.png" />
<a href ="test.com"><img src="test2.png" /></a>
我想检索与此格式的信息:
text - Hi
Link1 - <a href ="test.com">text link</a> notice without alt or other tag
Img1 - test.png
Link2 - <a href ="test.com"><img src="test2.png" /></a> again no tag
有没有一种方法,使在PHP?
你尝试过这么远吗?为了让您开始,请查看使用PHP的HTML解析器。 – Blender
查看相关链接,甚至搜索。 – mario
请参阅这里:http://stackoverflow.com/questions/292926/robust-mature-html-parser-for-php –