2014-06-19 42 views
1

我有一个新的即将到来的需求,我们必须在一个事务和流程中处理一个给定的描述,以打破预定义的类别。如何使用NLP处理简短描述

该描述是对医生处方的描述。

例如“服1丸,每天早上30天”“每次1粒,一天两次,两周”

注意这些描述必须被分解成类地说如。 时间重复类药物的,服用方式。

我想使用apache ONLP。

请提出如何在这个问题上前进,以使其更准确,因为解决方案必须是准确的。

+1

尝试ONLP。看看它是否适合您的用例 – CocoNess

+1

我可以从测试数据或伪数据创建树模式,然后尝试识别给定数据上的所有类型的模式。以便处理 – user3709980

回答

1

请看看cTAKES,一个开源项目。他们正在做你想做的事情。
您可以使用Finite State Machine来实现此目的。
指导this指导,设置此cTAKES项目。
另请参阅this javaDoc为药物频率单位。

2

你想做什么,在计算语言学术语中称为信息提取。你可以咨询this页面的初学者。