1
我正在使用Python和MySQL查询mediawiki数据库以获取文章的当前状态(即文章是否为FA,GA,GAN等),但一直未能这样做。获取维基百科文章的当前状态?
我知道当前状态存储在文本表的old_text
字段中。我想是这样的:
loc = select (locate('currentstatus', old_text))
query = ('select substring(old_text, '%s', 20) from wikidb where page_id = 1234' % (loc))
可惜禄给出了currentstatus
第一次出现,而不是最后的这是不是很“当前”,因为最新/最新状态是在底部。
我不知道如何解决它,或者如果我使用正确的方法。
您使用的是什么SQL API?数据来自哪里?即使你只是给出'currentstatus'字段的格式,我相信有人可以帮助你。 –
数据库字段'old_text'的格式是什么? –
我用特殊导出来下载文章,然后导入到mediawiki数据库中,我使用mysqldb(用于mysql的python模块)来查询mediawiki。 old_text是一个blob,currentstatus格式可以在http://en.wikipedia.org/wiki/Template:ArticleHistory查看 – hopeful