我有一个简单的4x2 html表,其中包含有关属性的信息。在beautifulsoup/python中查找带有特定文本的标记的索引
我试图提取值1972
,它的标题是Year Built
。如果我找到所有标签td
,我如何提取包含文本Year Built
的标签索引?
因为一旦找到该索引,我只需添加4
即可找到包含值1972
的标记。
下面是HTML:
<table>
<tbody>
<tr>
<td>Building</td>
<td>Type</td>
<td>Year Built</td>
<td>Sq. Ft.</td>
</tr>
<tr>
<td>R01</td>
<td>DWELL</td>
<td>1972</td>
<td>1166</td>
</tr>
</tbody>
</table>
例如,我知道,如果我输入的是指数2
和我的输出是标签Year Built
的文字,我可以做到这一点:
from bs4 import BeautifulSoup
soup = BeautifulSoup(myhtml)
td_list = soup.find_all('td')
print td_list[2].text
但是,如何使用文本Year Built
的输入来获得索引2
的输出?