2016-06-19 50 views
4

我正在用Python 3.4中的BeautifulSoup进行一些网络抓取。BeautifulSoup只提取顶级标签

现在我在学习期间遇到了一个问题: 我试图从网页获取表格行,我使用find_all()来获取它们,但在表格内部 - 有更多的表格和表格里面的行!我怎样才能得到只有 BeautifulSoup中的标签的顶级/一级通用或特定元素?

# Retrieves all the row ('tr') tags in table 
my_table.find_all('tr') 

顺便说一句,这个问题是这个问题的重复(仅用于那边的编程语言PHP):Extract only first level paragraphs from html

回答

8

显然有一种说法在方法find_all称为递归 (),默认设置为True

将其设置为false,使该方法仅返回顶层元素。

find_all('tr', recursive=False) 
相关问题