0
我正在浏览我的项目的Twitter网页。发现这个问题。
例如
网页:https://twitter.com/SrBachchan
页面源(通过右击在浏览器观察时):
视图源:https://twitter.com/SrBachchan网页及其下载的源代码是不同的。奇怪而真实。
下载由卷曲命令的源代码。下载的源代码(通过curl)与原始源代码不同。
我尝试使用python下载源代码(使用urllib2.urlopen)。它与通过卷曲获得的相同。
任何人都可以对此有所了解。
页面可以根据不同的用户代理进行不同的操作。 – 2013-05-06 15:44:57
那么,获取确切源代码的过程是什么? – VenkateshJN 2013-05-06 15:50:39
使用twitter apis [Twitter API](https://dev.twitter.com/docs/api/1.1)。通过apis你可以下载用户的所有东西 – 2013-05-07 06:10:44