2014-04-06 49 views
-1

我正在尝试访问,说一组属于具有某个名字的人的8,000个LinkedIn个人资料(例如,让我们说“拉里”),然后想要提取每个用户过去所持有的工作种类。有没有一种有效的方法来做到这一点?我需要每个拉里彼此独立采摘;基本上,遍历某人的网络不是一个很好的方法来做到这一点。有没有一种方法可以完全随机化拉里的挑选方式?使用Python提取LinkedIn信息

甚至不知道从哪里开始。谢谢。

+2

你认为改变“杰里”为“拉里”在你的问题,并没有提供任何代码,或样品,正如你在25分钟前问过的那样:http://stackoverflow.com/questions/22888729/python-visiting-random-linkedin-profiles会产生不同的结果? – BorrajaX

回答

0

启动:

试图抓取的响应LinkedIn让你在浏览器上几乎会自杀。

检查他们的APIs(特别是People's API)和他们的code samples

人民API中发现的重要声明:

人民搜索API是我们的审核API访问计划的一部分。您必须在此申请 并在使用此API之前获得LinkedIn的批准。

请记住,您可以编写一个查询和解析这些API的脚本。例如,检索与拉里用户与第一个名字http://api.linkedin.com/v1/people-search?first-name=Larry

一旦获得批准通过LinkedIn,你从他们的API获取的一些数据,并尝试了一些jsonXML解析(无论API的返回),你将有更多的东西具体要问。

如果你仍然想爬通过LinkedIn返回的HTML时你打https://www.linkedin.com/pub/dir/?first=Larry&last=&search=Search看看到BeautifulSoup