2015-06-28 143 views
1

删除换行符BeautifulSoup,我有以下几点:在美丽的汤

>>> tr = soup.find_all('tr')[1] 
<tr> 
<td>Adaptive Systems Seminar (HOC+WPO)</td> 
<td>wo</td> 
<td>13:00</td> 
<td>17:00</td> 
<td>4:00</td> 
<td>22-29, 32-36</td> 
<td>MANDERICK BERNARD</td> 
<td> </td> 
</tr> 

不过,我在文中只是有兴趣。所以我做

>>> tr(text=True) 
[u'\n', u'Adaptive Systems Seminar (HOC+WPO)', u'\n', u'wo', u'\n', u'13:00', u'\n', u'17:00', u'\n', u'4:00', u'\n', u'22-29, 32-36', u'\n', u'MANDERICK BERNARD', u'\n', u'\xa0', u'\n'] 

我想获得上面的列表中,但没有所有的换行。我已阅读文档,但找不到任何相关内容。

回答

1

一个办法是找到里面的所有td元素,并且使用get_text()

In [4]: [td.get_text(strip=True) for td in soup.select("tr > td")] 
Out[4]: 
[u'Adaptive Systems Seminar (HOC+WPO)', 
u'wo', 
u'13:00', 
u'17:00', 
u'4:00', 
u'22-29, 32-36', 
u'MANDERICK BERNARD', 
u'']