Q

网页及其下载的源代码是不同的。奇怪而真实。

twitter
web

2013-05-06 18 views 0 likes

0

我正在浏览我的项目的Twitter网页。发现这个问题。
例如
网页：https://twitter.com/SrBachchan
页面源（通过右击在浏览器观察时）：
视图源：https://twitter.com/SrBachchan 网页及其下载的源代码是不同的。奇怪而真实。

下载由卷曲命令的源代码。下载的源代码（通过curl）与原始源代码不同。

我尝试使用python下载源代码（使用urllib2.urlopen）。它与通过卷曲获得的相同。

任何人都可以对此有所了解。

2013-05-06 VenkateshJN

+0

页面可以根据不同的用户代理进行不同的操作。 – 2013-05-06 15:44:57

+0

那么，获取确切源代码的过程是什么？ – VenkateshJN 2013-05-06 15:50:39

+0

使用twitter apis [Twitter API]（https://dev.twitter.com/docs/api/1.1）。通过apis你可以下载用户的所有东西 – 2013-05-07 06:10:44

A

回答

1

我自己找到了解决方案。需要添加标头“--header”Accept-Language：en“'以获取该语言的确切源代码。

E.g. curl --header“Accept-Language：en”https://twitter.com/SrBachchan会完成这项工作。

2013-05-08 11:21:33 VenkateshJN

相关问题