这里是一个经常和长期的潜伏者:我通常在这里找到我的问题。但是,我遇到了一个简单而又含糊不清的项目,它可以逃脱我。我相当新的Python(目前使用版本3.6)。Python:刮取CSV文件请求
我在看:https://www.ishares.com/us/products/239726/
从我可以告诉,这里存在一些涉及jQuery的东西:寻找靠近页面的“控股”部分。如果选择“全部”,则不会选择“前10名”,而是可以选择持有“截至”。
如果选择了特定的历史月份,则会创建下载.csv的提示。我想要做的是获取从下拉列表中生成的每个csv文件,并返回到2006年9月29日。换句话说,自动下载为通过此下拉列表给出的每个请求生成的.csv文件。
为了给出一些(不一定相关的)上下文,我对大熊猫和bs4以及其他一些不太流行的库很熟悉。作为背景,我保留了几个桌面参考资料:Magnus Lie Hetland撰写的'Beginning Python'以及Wes McKinney撰写的'用于数据分析的Python:与Pandas,NumPy和IPython数据纠缠'。
我想就如何解决我可能忽略的这个问题的一些小方向。换句话说,面包屑是有帮助的,但不要求任何人为我做这些工作。我想尽可能多地探索和学习。
我应该使用哪些库/方法?我知道这是完全开放的,所以我想尽可能地坚持bs4和熊猫。其他图书馆也很有帮助,但那些将是重点。
谢谢!
如果你是一个很长时间的潜伏者,你知道这种问题不是关于[SO]的话题,你可以在[help/on-topic]看到。 – pvg
您可以构建与csv关联的url并使用'requests'模块获取数据。 – Frash
@pvg这绝对是在风口浪尖上,但是你能提供一个关于这个问题无效的特定标准吗?我觉得这是一个关于编程问题的具体问题,即使它是一个开放式的问题,所以我不确定这对于其他人来说是多么清晰,这是无关紧要的。 – AlVaz