我正在用Flash写一个网站,用Python编写。我可以在Firebug中看到该页面加载其Flash文件,然后在.asmx文件中加载一些背景数据。Scraping Flash:访问后台文件,也许在机械化?
背景数据是我感兴趣的 - 所以如何才能获得.asmx文件?我已经知道它叫什么了。
我无法直接访问.asmx文件,但我可以使用机械手抓住它吗?
---更新----
我刮的页面是http://www.citroen.co.uk/new-cars/car-range/#/configurator/1C58AF/pop/pre-configuration/
.asmx文件是https://sfg-bpf.servicesgp.mpsa.com/uk/services/ServicePSAGF_Dealer.asmx - 我可以在Firebug查看。
我在上面添加了链接。如果我可以获取.asmx文件中的底层XML,则可以提取我需要的数据。 – AP257 2010-09-26 18:26:51
链接无关紧要;你也需要实际的post/get参数。尝试使用像Charles这样的代理来访问页面,因为它会告诉你实际的输出(Firebug也是这样做的,只需要深入查找文件加载信息的响应选项卡即可)。 – zeh 2010-09-27 18:58:59