2013-08-26 34 views
0

我只想得到dd内的东西。 我有这样的代码:如何获得dd内的项目?

import urllib 
from bs4 import BeautifulSoup 

url = 'http://www.brothersoft.com/windows/mp3_audio/' 
pageHtml = urllib.urlopen(url).read() 
soup = BeautifulSoup(pageHtml) 

for a in soup.select('div.coLeft.cate.mBottom a[href]'): 
    print "http://www.brothersoft.com"+ a['href'] 

但输出给所有的类中。我只需要dd内的项目。如何获得?

回答

1

只要把dd其间:

for a in soup.select('div.coLeft.cate.mBottom dd a[href]'): 
    #           ^^ 
    print "http://www.brothersoft.com"+ a['href']