我试图从网站上刮取一些信息,但在阅读相关页面时遇到困难。页面似乎首先发送一个基本的设置,然后是更详细的信息。我的下载尝试似乎只捕获基本设置。到目前为止,我已经尝试过urllib和机械化。网站抓取问题网站
尽管在查看页面源代码时看不到我想要的部分,但Firefox和Chrome在显示页面时没有任何问题。
示例URL是https://personal.vanguard.com/us/funds/snapshot?FundId=0542&FundIntExt=INT
我想,例如,平均期限和平均持续时间从页面的右下角。问题不在于从页面中提取该信息,而是在下载页面以便我可以提取信息。
这就行了。虽然其他一些答案是很好的一般答案,但这使我能够做到我想要的很好而简单。 – foosion