2011-11-05 59 views
1

我需要你的帮助。我解析维基百科文章并使用维基媒体API。我想阅读{{ }}之间的文字。这是我的wikimedia api query。我试过但没有找到任何运气。谁能帮帮我吗 ?非常感谢。解析维基媒体api

def getCategory(title): 
paramsd = {'action': 'query', 'prop': 'revisions', 'rvprop': 'content', 'format': 'xmlfm', 'rvsection': 0,'titles':title} 
params = urllib.urlencode(paramsd) 
req = urllib2.Request(url='http://en.wikipedia.org/w/api.php', data=params) 
f = urllib2.urlopen(req) 
+1

*“您正在查看XML格式的HTML表示。 HTML很适合调试,但可能不适合您的应用程序。“* - 应该给你一个提示。 – poke

回答

0

您的代码有错误。

'format': 'xmlfm' 

应改为

'format': 'xml' 

这样的话,你会得到XML。