1
我使用python编程,并使用美丽的汤来解析The History Channel's News Feed中的文章。到目前为止,我可以弄清楚如何从单个文章中获得文章文本,但我无法弄清楚如何从无限的feed中获取链接。我尝试插入RSS feed并使用feedparser,但只提供了20篇最新的文章。从无限大的网页获取所有文章链接?
有没有办法让我失去更多? Pythonic方法首选!
我使用python编程,并使用美丽的汤来解析The History Channel's News Feed中的文章。到目前为止,我可以弄清楚如何从单个文章中获得文章文本,但我无法弄清楚如何从无限的feed中获取链接。我尝试插入RSS feed并使用feedparser,但只提供了20篇最新的文章。从无限大的网页获取所有文章链接?
有没有办法让我失去更多? Pythonic方法首选!
在引擎盖下,无限滚动通常是通过从可以直接从url访问的分页结果中注入记录来处理的。使用Postman Interceptor,您可以发现分页结果的url模式。
结果本页面的第二页是:http://www.history.com/api/html/news?sidebars=aetn_content&includejs=aetn_content&page=2
循环一翻和刮走!
非常感谢! –