0
我有兴趣查看网站使用情况,问题类型和堆栈溢出问题的答案。有没有办法下载所有的内容?有没有办法从堆栈溢出下载所有的问题和答案?
我已经考虑过用美丽的汤或类似的选项作为网页抓取,但认为有这么多专家用户的信息可能很容易通过API获得。
我有兴趣查看网站使用情况,问题类型和堆栈溢出问题的答案。有没有办法下载所有的内容?有没有办法从堆栈溢出下载所有的问题和答案?
我已经考虑过用美丽的汤或类似的选项作为网页抓取,但认为有这么多专家用户的信息可能很容易通过API获得。
是的,你猜,有一个JSON API,检查http://blog.stackoverflow.com/2012/09/stack-exchange-api-v2-1/
要获得通过举例而言,所有的问题:https://api.stackexchange.com/docs/questions
它需要一个纲领性的浏览器和JSON解析器。这是非常简单的perl,python或ruby。
在评论由fvu提出的另一种解决方案是解析full snapshot of any stackexchange site
这不是汤,但可以肯定的是美丽的。谢谢! – Minnow 2014-12-27 18:30:25
更好的是,有一个完整的转储[可供下载](http://blog.stackoverflow.com/category/cc-wiki-dump/) – fvu 2014-12-27 18:33:21