python beautifulsoup获取html标记内容

如何获取html标记与美丽的内容？例如<title>标签的内容？python beautifulsoup获取html标记内容

我想：

from bs4 import BeautifulSoup 

url ='http://www.websiteaddress.com' 
soup = BeautifulSoup(url) 
result = soup.findAll('title') 
for each in result: 
    print(each.get_text())

但是什么都没有发生。我正在使用python3。

来源

2016-02-28 niloofar

您需要先获取网站数据。您可以使用urllib.request模块执行此操作。请注意，HTML文档只有一个标题，因此不需要使用find_all()和一个循环。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 

url ='http://www.websiteaddress.com' 
data = urlopen(url) 
soup = BeautifulSoup(data, 'html.parser') 
result = soup.find('title') 
print(result.get_text())

来源

2016-02-28 13:53:44

谢谢你有帮助:) – niloofar

@niloofar很高兴能帮到你！ –

python beautifulsoup获取html标记内容

回答

相关问题