我有一个从网站检索到的Python字符串"''Grassmere''"
。Python - 显示包含实体引用的字符串为普通文本
我想有'
显示为正确的ASCII符号('
),但由于某种原因,蟒蛇坚持刚打印的ASCII码。
我有一个从网站检索到的Python字符串"''Grassmere''"
。Python - 显示包含实体引用的字符串为普通文本
我想有'
显示为正确的ASCII符号('
),但由于某种原因,蟒蛇坚持刚打印的ASCII码。
电池,包括为这个一个
>>> import xmllib
>>> X=xmllib.XMLParser()
>>> X.translate_references("''Grassmere''")
"''Grassmere''"
或没有额外的模块:
re.sub("&#(\d+);", lambda m: chr(int(m.group(1))), "''Grassmere''")
当然除了're';) – 2010-01-31 09:48:18
但是这对于'&'等不起作用。 – 2010-01-31 09:48:52
见http://stackoverflow.com/questions/1208916/decoding-html-entities-with-python 。 – kennytm 2010-01-31 09:07:31
@KennyTM:不完全相同的问题; BS处理实体引用本身。 – 2010-01-31 09:09:08