我正试图从kaggle.com/users下的配置文件和结果选项卡中抓取数据。在使用CSS填充内容的Python中刮取网站
我以前曾与BeautifulSoup合作过,并且知道如何获取个人用户的链接并导航到他们。但是,默认情况下仅填充“配置文件”选项卡。 “结果”选项卡内容仅在用户点击该内容后才动态填充。
如果您在id为'profile2-content'的div下查看,每个div下面对应于一个选项卡的内容,但除了其中一个子选项卡以外,其他所有选项都将样式设置为display:none。
一旦我到达每个用户的配置文件选项卡(默认情况下),然后如何获取要加载的结果内容。一旦完成,我可以查找ID为'profile2-content-results'的固定div并提取其内容。
感谢您的帮助!
你的代码知道什么?什么不行?你想要从什么页面爬取什么信息 – 2014-12-05 08:28:03
@VincentBeltman我期待提取配置文件和结果div下的HTML – PerennialN00b 2014-12-05 10:39:38