我想知道是否有方法从我的银行网站用Python获取信息,我喜欢检索我的卡片历史记录并显示它,并且可能每月将它保存到文本文档中。Python从安全网站获取数据
我发现了网址登录并从网站获取信息,这是从浏览器工作,但我一直在使用liburl2从Python“打开”网页,我觉得它不工作,因为一些cookie或会话的东西。
我能得到我从一个网站,不需要与urllib2的登录,然后保存实际的HTML,后来通过它想要的任何信息,但我不能在我的银行网站,
任何帮助将理解
我想知道是否有方法从我的银行网站用Python获取信息,我喜欢检索我的卡片历史记录并显示它,并且可能每月将它保存到文本文档中。Python从安全网站获取数据
我发现了网址登录并从网站获取信息,这是从浏览器工作,但我一直在使用liburl2从Python“打开”网页,我觉得它不工作,因为一些cookie或会话的东西。
我能得到我从一个网站,不需要与urllib2的登录,然后保存实际的HTML,后来通过它想要的任何信息,但我不能在我的银行网站,
任何帮助将理解
这是网络Scarping的一部分:
https
https
不与mechanize
问题,BeautifulSoup
urllib2
与HTTPCookieJar
也能正常工作mechanize
考虑您的银行站点的情况:
问题,你会面对这样的:
js
。这又需要很多努力。AJAX
在页面加载后从服务器获取数据。因此,它会要求你采取了很多的努力,做这个任务。
此外,如果您尝试这样做,你因为银行阻止访问您的帐户的风险点是快阻止上登录或验证码3-4不成功的尝试帐号等
所以,想在你做之前。
如果您在脚本中有您的用户名和密码,您是否可以将它们传递到网站以访问您的数据?这不是说像Mint.com这样的网站如何工作? – 2015-04-01 20:29:12
这可能是困难的。您可能会使用浏览器线束框架来实际加载浏览器中的页面并自行填写表单字段。 – katrielalex 2012-03-10 14:56:38
我遇到了这个http://wwwsearch.sourceforge.net/mechanize/ - 这是一个浏览器线束框架吗? – 2012-03-10 15:00:51
http://doc.scrapy.org/en/latest/intro/overview.html可能值得一看。 – lvc 2012-03-10 15:03:57