2010-12-23 43 views
2

确定之前验证到一个网页,所以我有一个设计从网页读取和分析源找到我的谷歌的AdSense户头的资金量的代码。从部分读是这样的:使用Python和的urllib2如何阅读源代码

import urllib2 
import re 
s = urllib2.urlopenopen('https://www.google.com/adsense/report/overview?timePeriod=alltime').read() 
results = re.findall('[$][1-9][1-9][1-9][.][1-9][1-9]',s) 
print results 

,使代码工作正常,除外来访问我的帐户,我必须先登录(杜)的事实,但我的问题是,我不知道如何使用python在登录页面进行身份验证,然后进入账户页面。所有我需要知道的是如何进行身份验证,然后进入显示我的帐户信息的页面,以及使用Python 2.7的方式,非常感谢!!!!!!

回答

0

网页验证了该网站,并可以通过多种方式来完成,通常需要到页眉或Cookie添加到请求。这些头文件的外观应该依赖于web应用程序,如果你使用http或者https,并且这些cookies通常是你登录页面时返回的东西,这意味着你需要向登录页面发出请求页面并跟踪这些cookie。

所以,在我们告诉你如何在Python中完成它之前,你应该弄清楚如何去做。谷歌AdSense身份验证如何工作?

0

我敢打赌,有一个python库在那里登录到谷歌服务。也许你可以劫持那个用于你的用途?

1

恐怕,你将有很多运气试图为你想要做的事情获得简单的解决方案。

首先,没有open法的urllib2。你可能会试图为urllib2.urlopen

您可能首先想了解更多有关使用的urllib2认证。 This link提供了一些信息。

在您的身份验证对谷歌的AdSense的特定情况下,你将不得不找出哪些URL和Cookie是谷歌的Adsense期待认证您启动于基于摘要式身份验证方法之前。有poster谁试图做同样的事情,但没有太多的运气。

获取数据编程方式从谷歌使用自己的API,在这种情况下Google Adsense API的最佳方式,也有上市reporting API秒,你可能需要使用SOAPpy自省,并得到你想要的。

2

你可以尝试使用mechanize,第三方包,就像一个浏览器。

这个想法是得到机械化来填充通常在浏览器中手动填写的认证表单。