2012-04-10 60 views
4

我想使用BeautifulSoup解码实体,但没有运气。使用BeautifulSoup解码html实体

from BeautifulSoup import BeautifulSoup 

decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES) 

print decoded 

输出根本没有解码。我在这里找到了很多使用这种方法的答案。 我是否做错了什么?

我想为此使用BeautifulSoup,所以请不要打扰告诉我,标准库有一个解码实体的方法。

回答

1

您需要print decoded.contents

>>> print decoded 
<p> </p> 
>>> print decoded.contents 
[u'<p> </p>']