2010-01-31 14 views
2

我有一个从网站检索到的Python字符串"''Grassmere''"Python - 显示包含实体引用的字符串为普通文本

我想有'显示为正确的ASCII符号('),但由于某种原因,蟒蛇坚持刚打印的ASCII码。

+0

见http://stackoverflow.com/questions/1208916/decoding-html-entities-with-python 。 – kennytm 2010-01-31 09:07:31

+0

@KennyTM:不完全相同的问题; BS处理实体引用本身。 – 2010-01-31 09:09:08

回答

3

电池,包括为这个一个

>>> import xmllib 
>>> X=xmllib.XMLParser() 
>>> X.translate_references("''Grassmere''") 
"''Grassmere''" 
1

或没有额外的模块:

re.sub("&#(\d+);", lambda m: chr(int(m.group(1))), "''Grassmere''") 
+2

当然除了're';) – 2010-01-31 09:48:18

+1

但是这对于'&'等不起作用。 – 2010-01-31 09:48:52

相关问题