2011-08-02 32 views
1

我们正在使用LAMP开发一个基于需求的社交媒体站点。PHP中的恢复/ CV解析

对于我们想要在PHP中执行Resume/CV解析。

我们能够解析Email-id和电话,但不知道如何从简历中解析其他信息,如全名,地址,教育程度,就业等。

加履历/简历可以在不同的格式,如DOC,HTML,RTF,TXT等

有谁知道生根粉PHP脚本,在这里我们可以获取数据。或任何开发理念来启动。

在此先感谢。

+0

您是否试图从任意格式化的简历中获取该信息?听起来像我不可能完成的任务。 – JJJ

+3

这是一个**难题**。没有简单的方法来解析所有的简历;即使在大型招聘委员会和招聘网站上也不存在此类计划。他们的进口商总是混乱,不能处理大部分上传的东西。我希望你至少花几个星期的开发时间来做这个尝试。 –

+0

你为什么不简单地创建一个自己的简历网页表单,并把它放到你的网站上?您当然需要创建一个尽可能通用的布局以满足所有申请人的需求,但另一方面,您可以将所有数据直接存储在数据库中,而无需使用任何可能不准确的CV解析器。更不用说将数据存储在数据库中的好处,比如排序,查询等。 – brezanac

回答

4

我会看看现有的简历解析器是否有一个您可以使用的API或可以添加到您的框架的自定义钩子。退房SovrenTextKernel

据Sovren的网站,他们引述:

一旦您的SovrenConvertAndParse Web服务的实例 运行后,您将通过SOAP访问它。几乎所有的编程 环境都能够自动从Web服务的WSDL自动创建Web服务客户端或Web服务代理。我们还为 提供了针对某些环境(如PHP)的样本客户端。无论如何,创建Web服务客户端的 应该是一个非常快速的任务:通常是几分钟,也许几个小时的 。

创建Web服务客户端后,您可以调用Web服务上的单个 方法来转换和解析一个 操作中的简历,并接收HR-XML输出作为回报。

http://www.sovren.com/sovren-products-parser-implementation.php

http://www.sovren.com/sovren-products-web-service.php

TextKernel报价:

所有类型的文档(文档处理DOC,DOCX,PDF,RTF, HTML,TIFF,TXT,XML, MSG和EML类型文档)。 Textkernel提供以下11种语言:英文,德文,法文,荷兰文,西班牙文,瑞典文,丹麦文,波兰文,罗马尼亚文,意大利文,斯洛伐克文。

看来他们的Web界面被称为Sourcebox:

Sourcebox是精华!Textkernel的简历 解析软件完全可配置的。

Sourcebox拥有多语言网页界面,供员工管理CV队列并手动检查和纠正异常。

Sourcebox可用作许多领先CRM,ATS, 的接口匹配引擎,HRMS系统和您自己的网站或招聘 门户。

http://www.textkernel.com/hr_solutions.php?nav=sourcebox

他们都似乎有希望够利用,而不是要在这里重新发明轮子,尤其是用PHP。

+1

增加了一些infoz – Maverick

+0

非常有趣! +1 – Gordon

+0

@Maverick似乎错过了[RChilli](http://www.rchilli.com)和Hireability进入你的讨论。我们为我们的客户实施了RChilli和Hireability,并发现RChilli团队更积极主动,并从其他玩家那里获得帮助。 –