0
我想使用的urllib2和beautifulSoup凑这个网站https://www.spdrs.com/product/fund.seam?ticker=SPY。但是,我认为我从urllib2获得的html不完整。下面显示的节点<span>
之间的任何内容都不是从urllib2读取的字符串的一部分。的urllib2的urlopen HTML不全
<span xmlns="http://www.w3.org/1999/xhtml" id="performancePanel">
bunch of divs in here.
</span>
为什么会出现这种情况?我怀疑它与xmlns有关,因为我从来没有见过任何人将这个属性放在一个跨度上。
我不能看到你所提到的跨度标签。也许网站改变了,另一种可能是,这个标签是在页面加载后由JS生成的。 – PasteBT
@PasteBT感谢您的回复。您可以尝试在控制台中搜索ID。我在Chrome上,我可以在控制台中找到它。加载页面后我没有看到任何ajax调用。当你说这个部分是由javascript生成的,你的意思是代码的一部分被硬编码成javascript并在DOM加载后插入它?这似乎不正确.. – zsljulius