基本上我使用php file_get_contents()
从URL
获取内容。使用php获取HTML标签内容
获得页面的源代码后,我从网页源
<div class="span2 box-product" data-store="kimstore" data-product-id="cpnYKmW6D5" data-product-title="Nokia-900-Lumia">
<a href="/Nokia-900-Lumia/p-cpnYKmW6D5" title="Nokia 900 Lumia Php 14,300">
<img src="https://m-md.s3.amazonaws.com/storefront/kimstore/media/46/68/2d/99/68159647b67e5b1a2d124f9-120x90" width="120" height="90" title="Nokia 900 Lumia Php 14,300" alt="Nokia 900 Lumia Php 14,300" />
</a>
<p class="title">
<a href="/Nokia-900-Lumia/p-cpnYKmW6D5" title="Nokia 900 Lumia Php 14,300">
Nokia 900 Lumia
</a>
</p>
<p class="price">Php 14,300</p>
<p class="shop">
<a href="/kimstore" title="kimstore">kimstore</a>
</p>
</div>
所以,我有<div class="span2 box-product"
和结束标记之间,以获得这部分数据得到的数据。
,然后在那之后,我必须从中得到3个数据: 1.数据存储 2.数据产品称号 3.价格
我一直在使用regex
尝试,但没有运气这种方式。任何建议做什么,技术使用?提前致谢。
http://php.net/dom – DaveRandom 2013-04-30 08:59:15
什么你正在尝试做的可能是:a)侵犯版权并二)错误的方法。 IANAL。 – PointedEars 2013-04-30 09:12:14
可能重复的[如何解析和处理HTML/XML?](http://stackoverflow.com/questions/3577641/how-to-parse-and-process-html-xml) – Quentin 2013-04-30 09:21:16