我想知道如何在远程网站上查找数字并将其作为变量。如何在使用获取内容后过滤数据
例如,如果我想查找“AMZN”的股票报价,我将使用卷页或获取页面上的内容“http://stock-quotes.com/AMZN”,使其成为一个变量字符串$ contents
既然我有$内容,我将如何找到AMZN报价?我正在考虑使用正则表达式来缩小行数,例如找到“AMZN = 35分”,然后执行另一个函数删除字符串开头和结尾的“AMZN =”和“points”,以便“ 35“就剩下了。
这是人们如何做到的吗?
我想知道如何在远程网站上查找数字并将其作为变量。如何在使用获取内容后过滤数据
例如,如果我想查找“AMZN”的股票报价,我将使用卷页或获取页面上的内容“http://stock-quotes.com/AMZN”,使其成为一个变量字符串$ contents
既然我有$内容,我将如何找到AMZN报价?我正在考虑使用正则表达式来缩小行数,例如找到“AMZN = 35分”,然后执行另一个函数删除字符串开头和结尾的“AMZN =”和“points”,以便“ 35“就剩下了。
这是人们如何做到的吗?
我一直在做(在蜘蛛等说)是使用PHP中的simple_html_dom库,然后检查该网站的标记。
如前所述,缺点是如果标记更改,则需要修改代码,但通常很简单,如果使用具有信息标记的源代码(元素上的一致类名称你需要等等),那就更容易了。
最好的办法是DOM,但使用的preg_match匹配( '#AMZN =(*)指出#',$内容$匹配)是容易的,但如果标记改变比赛会打破,需要看到实际的页面 – 2011-05-22 23:39:02
为什么不张贴这个答案,而不是评论? – 2011-05-22 23:43:47
@AJ因为使用reg表达式匹配而不是DOM,通常以downvotes结束 – 2011-05-22 23:45:21