Python - 显示包含实体引用的字符串为普通文本

我有一个从网站检索到的Python字符串"''Grassmere''" 。Python - 显示包含实体引用的字符串为普通文本

我想有'显示为正确的ASCII符号（'），但由于某种原因，蟒蛇坚持刚打印的ASCII码。

2010-01-31 Chris

见http://stackoverflow.com/questions/1208916/decoding-html-entities-with-python 。 – kennytm 2010-01-31 09:07:31

@KennyTM：不完全相同的问题; BS处理实体引用本身。 – 2010-01-31 09:09:08

电池，包括为这个一个

>>> import xmllib 
>>> X=xmllib.XMLParser() 
>>> X.translate_references("&#039;&#039;Grassmere&#039;&#039;") 
"''Grassmere''"

2010-01-31 09:40:32

或没有额外的模块：

re.sub("&#(\d+);", lambda m: chr(int(m.group(1))), "&#039;&#039;Grassmere&#039;&#039;")

2010-01-31 09:46:30

当然除了're';） – 2010-01-31 09:48:18

但是这对于'&'等不起作用。 – 2010-01-31 09:48:52

回答