2012-04-11 51 views
-2

===获取页面的源代码后改变 ,让我们把它叫做SRCbeautifulSoup过滤一些数据

我用BS4解析:

soup = BeautifulSoup(src) 

的认为是我得到的过滤数据。

实施例:看此URL 的= “http://www.imdb.com/name/nm0000905/” 源使用BS4后:

soup = BeautifulSoup(src) 

经滤波的数据是 “已知的”和“相关新闻”等所有内容。 所以打开汤时,我会看到页面的上半部分。 (见python,not getting full response) 我还想与bs4(我也有) 任何建议吗?

感谢您的帮助。

+0

“过滤的数据”? – 2012-04-11 13:17:11

+0

对你的问题更具体。告诉我们你试过的是什么,你的期望是什么以及你得到了什么。 – KurzedMetal 2012-04-11 13:36:55

+0

现在您已经添加了一些,但我仍然没有看到您的要求。这不仅仅是四小时之前你的问题的重复吗? – 2012-04-11 15:05:08

回答

2

对此提出建议?是的,请使用the documentation中指定的库。

+0

这是我使用的lib,使问题! – aminonsh 2012-04-11 13:24:37

+0

@aminonsh但是你没有解释*你的问题*! – 2012-04-11 13:32:31

+0

@克里斯摩根看到变化 – aminonsh 2012-04-11 13:53:13