2016-02-28 250 views
0

如何获取html标记与美丽的内容?例如<title>标签的内容?python beautifulsoup获取html标记内容

我想:

from bs4 import BeautifulSoup 

url ='http://www.websiteaddress.com' 
soup = BeautifulSoup(url) 
result = soup.findAll('title') 
for each in result: 
    print(each.get_text()) 

但是什么都没有发生。我正在使用python3。

回答

2

您需要先获取网站数据。您可以使用urllib.request模块执行此操作。请注意,HTML文档只有一个标题,因此不需要使用find_all()和一个循环。

from urllib.request import urlopen 
from bs4 import BeautifulSoup 

url ='http://www.websiteaddress.com' 
data = urlopen(url) 
soup = BeautifulSoup(data, 'html.parser') 
result = soup.find('title') 
print(result.get_text()) 
+0

谢谢你有帮助:) – niloofar

+0

@niloofar很高兴能帮到你! –