2013-05-06 18 views
0

我正在浏览我的项目的Twitter网页。发现这个问题。
例如
网页:https://twitter.com/SrBachchan
页面源(通过右击在浏览器观察时):
视图源:https://twitter.com/SrBachchan网页及其下载的源代码是不同的。奇怪而真实。

下载由卷曲命令的源代码。下载的源代码(通过curl)与原始源代码不同。

我尝试使用python下载源代码(使用urllib2.urlopen)。它与通过卷曲获得的相同。

任何人都可以对此有所了解。

+0

页面可以根据不同的用户代理进行不同的操作。 – 2013-05-06 15:44:57

+0

那么,获取确切源代码的过程是什么? – VenkateshJN 2013-05-06 15:50:39

+0

使用twitter apis [Twitter API](https://dev.twitter.com/docs/api/1.1)。通过apis你可以下载用户的所有东西 – 2013-05-07 06:10:44

回答

1

我自己找到了解决方案。 需要添加标头“--header”Accept-Language:en“'以获取该语言的确切源代码。

E.g. curl --header“Accept-Language:en”https://twitter.com/SrBachchan会完成这项工作。