0
我想获取维基百科上所有关于历史事件的文章?什么是最好的方式去做这件事? Wiki API?数据库转储?我已经检查过DBPedia,目前它似乎相当有限(虽然仍然令人印象深刻)。如何获取维基百科上的所有历史事件?
我想获取维基百科上所有关于历史事件的文章?什么是最好的方式去做这件事? Wiki API?数据库转储?我已经检查过DBPedia,目前它似乎相当有限(虽然仍然令人印象深刻)。如何获取维基百科上的所有历史事件?
要查看所有关于历史事件的文章的列表,请查看the Events category,特别是its subcategory Events by time。要获取某个类别及其所有子类别中的所有文章,您可以使用API或SQL转储(至少需要表categorylinks
和page
;如果您使用.Net,my library可以帮助您)。
要真正获得许多文章的文本,您应该使用XML转储,可能是pages-articles
。
从XML转储中提取数据的任何推荐工具? – user1530580
另外,我很好奇为什么要经历事件类别,而不是历史事件? – user1530580
@ user1530580我还没有使用过那么多,我认为几乎所有的语言都有合理的XML库,请选择一个。只要确保你没有试图一次加载整个XML到内存中。你要求事件,所以我寻找包含事件的类别。但只有你知道你到底需要什么。 – svick