Python：打印TD标签的特定文本行

这是一个简单的我相信。我正在解析一个网站，我正在尝试获取标签之间的特定文本。该文本将== [撤销，活动，默认]我正在使用Python。我已经能够打印出所有内部文本结果，但是我无法在网络上找到特定文本的良好解决方案。这里是我的代码Python：打印TD标签的特定文本行

from BeautifulSoup import BeautifulSoup 
import urllib2 
import re 

url = urllib2.urlopen("Some URL") 
content = url.read() 
soup = BeautifulSoup(content) 
for tag in soup.findAll(re.compile("^a")): 

print(tag.text)

来源

2013-05-27 Roland Smith

我无法理解你的问题。你想得到什么？ – kirelagin

@kirelagin我想要获取标签之间的特定文本。该文本将被“撤销”，“有效”或“默认”。我希望清除它，如果我不知道如何改写 –

使用'tag.text'有什么问题？ – kirelagin

我还不确定我明白你在做什么，但我会尽力帮忙。

soup.find_all('a', text=['revoked', 'active', 'default'])

这将只选择那些<a …>有给出的字符串作为其文本的一个标签。

来源

2013-05-27 21:34:30 kirelagin

多数民众赞成它是先生，非常感谢你 –

我已经在类似的场合使用了下面的代码片段。看看这是否符合你的目标：

table = soup.find(id="Table3") 

for i in table.stripped_strings: 
    print(i)

来源

2013-05-27 21:19:52

我试过你的代码，我得到这个错误“TypeError：'NoneType'对象不可迭代” –

Python：打印TD标签的特定文本行

回答

相关问题