2012-06-13 42 views
0

我想要获取这个元标记<meta content="Rs.55.09" itemprop="price">内的内容或立即在元标记(<meta content="Rs.55.09" itemprop="price"> Rs.55.09)之后的内容,即需要产品的价格。是否有任何正则表达式来获取数据。使用正则表达式抓取数据

在此先感谢...

+0

到目前为止您尝试过什么?请向我们展示您的代码,它出现的错误以及您正在处理的数据 –

+0

您有一个包含''标签的字符串,还是它是更大文档的一部分? – DaveRandom

+0

@HaraldBrinkhof:我正在做一个应用程序,当用户搜索谷歌应用程序时,它会返回应用程序的详细信息,如包ID,标题,截图的URL和价格。我正在获取应用程序的网址。现在,我想获取该网址的内容(价格,评分等)。 – Balu

回答

3

这工作:

preg_match('/<meta content=\"(.*?)\" itemprop=\"price\">/i', $data, $matches); 

不过,我会非常建议考虑DOM文档或其他HTML解析器,因为不推荐使用正则表达式是像这样解析HTML。

Read more about HTML parsers hereread more about why not to use regex here

+0

:它不工作。我应该使用索引与像$ matches [0]这样的$匹配。 – Balu

+0

'echo $ matches [1];',但是通过一些简单的试验和错误,你可以发现你自己...... – Jeroen

+1

@Balu:hu?是的,你应该......也许你应该在使用它们之前阅读PHP中的正则表达式函数;) - > php.net/manual/en/function.preg-match.php(并按照Jeroens关于解析器的建议) – cypherabe