我使用BeautifulSoup4刮包含关注以下元素的页面:BeautifulSoup4发现或选择串子begining包含非字母数字
:<span class="Fw(b) Fz(36px) Mb(-4px)" data-reactid="279">170.55</span>
我曾尝试以下,其中没有工作
from bs4 import BeautifulSoup
import re
soup = Beautiful(fetch_page_html())
#Attempt 1
elem = soup.select("span[class^=Fw(b) Fz(36px) Mb(-4px)]")
#Attempt 2
elem = soup.find('span', class_=re.compile(r'^<span class="Fw(b) Fz(36px) Mb(-4px)'))
我在做什么错?
[附录]
请,不建议我使用的,因为XYZ的另一个刮刀库,这不是我问这里有什么,我知道还有其他的拼抢库在那里,而bs4现在可能在牙齿上变得漫长,但这是我习惯的,我需要修补现有的脚本。
不幸的是没有。它返回一个空列表。我开始认为BS4已经过时了。开始看Scrapy - DESPITE我在OP中说过的话。 –
@HomunculusReticulli如果您可以提供链接,可以对其进行测试。 – MYGz
这里是[链接](http://finance.yahoo.com/quote/IBM/options?p=IBM&straddle=false&date=1486080000)。我试图拿取** 170.55 **的价格(因为它发生,也是时间戳**美国东岸时间下午4:00) - 但这可能是另一个问题)。 –