-1
我想抓取印度新闻网站及其档案(例如thehindu.com,indianexpress.com和timesofindia.com)。如何抓取新闻网站(仅限内容)?
我听说过Java中用于提取内容的样板库。但有没有在Python中的任何图书馆做到这一点,以及如何做到这一点?
如果这是一个重复的问题,请帮我指出。
我想抓取印度新闻网站及其档案(例如thehindu.com,indianexpress.com和timesofindia.com)。如何抓取新闻网站(仅限内容)?
我听说过Java中用于提取内容的样板库。但有没有在Python中的任何图书馆做到这一点,以及如何做到这一点?
如果这是一个重复的问题,请帮我指出。
Scrapy是Python的一个流行刮框架
你的问题的标题给出了[谷歌](https://www.google.com/search?q=How+to+crawl+一些不错的三分球新闻+网站+(内容+只)+蟒蛇) – lanzz