Q

如何抓取新闻网站（仅限内容）？

2014-02-21 52 views -1 likes

-1

我想抓取印度新闻网站及其档案（例如thehindu.com，indianexpress.com和timesofindia.com）。如何抓取新闻网站（仅限内容）？

我听说过Java中用于提取内容的样板库。但有没有在Python中的任何图书馆做到这一点，以及如何做到这一点？

如果这是一个重复的问题，请帮我指出。

2014-02-21 mridul

+2

你的问题的标题给出了[谷歌]（https://www.google.com/search?q=How+to+crawl+一些不错的三分球新闻+网站+（内容+只）+蟒蛇） – lanzz

A

回答

5

Scrapy是Python的一个流行刮框架

2014-02-21 16:43:19 shaktimaan

相关问题