这是我的第一个BS编码实验。
网站我刮是here
我遇到的问题是这段代码:<span>之前的文本标记
<div class="cmg_team_name">
ARST
<span>101</span>
</div>
这里是我的代码:
import numpy as np
from bs4 import BeautifulSoup
import urllib2
url = "http://covers.com/Sports/NCAAF/Matchups?selectedDate=2015-10-13"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read(), 'html.parser')
universities = soup.find_all('div',{'class':'cmg_team_name'})
#for university in universities:
# print university.contents
# print "****************"
print universities[0]
我的问题是我怎么只能访问span标志之前的文本。在这个例子中,我只想要ARST
。 我试过print universities[0].get_text()
,print universities[0].string
得到None
,也是数组符号。我知道我将如何在C++中做到这一点,但我假设python/BSoup会在一行中做到这一点...感谢!
请不要更新您的代码以包含解决方案,因为它会使答案无效。 – ChrisF