2014-02-21 52 views
-1

我想抓取印度新闻网站及其档案(例如thehindu.com,indianexpress.com和timesofindia.com)。如何抓取新闻网站(仅限内容)?

我听说过Java中用于提取内容的样板库。但有没有在Python中的任何图书馆做到这一点,以及如何做到这一点?

如果这是一个重复的问题,请帮我指出。

+2

你的问题的标题给出了[谷歌](https://www.google.com/search?q=How+to+crawl+一些不错的三分球新闻+网站+(内容+只)+蟒蛇) – lanzz

回答