2013-05-27 32 views
0

这是一个简单的我相信。我正在解析一个网站,我正在尝试获取标签之间的特定文本。该文本将== [撤销,活动,默认]我正在使用Python。我已经能够打印出所有内部文本结果,但是我无法在网络上找到特定文本的良好解决方案。这里是我的代码Python:打印TD标签的特定文本行

from BeautifulSoup import BeautifulSoup 
import urllib2 
import re 

url = urllib2.urlopen("Some URL") 
content = url.read() 
soup = BeautifulSoup(content) 
for tag in soup.findAll(re.compile("^a")): 

print(tag.text) 

回答

1

我还不确定我明白你在做什么,但我会尽力帮忙。

soup.find_all('a', text=['revoked', 'active', 'default']) 

这将只选择那些<a …>有给出的字符串作为其文本的一个标签。

+0

多数民众赞成它是先生,非常感谢你 –

0

我已经在类似的场合使用了下面的代码片段。看看这是否符合你的目标:

table = soup.find(id="Table3") 

for i in table.stripped_strings: 
    print(i) 
+0

我试过你的代码,我得到这个错误“TypeError:'NoneType'对象不可迭代” –