最近我正在研究我的课程项目,它是一个可以自动帮助填充基于用户声音的消费表单的android应用程序。因此,这里是一个例句:
在这种情况下应该使用哪种机器学习模型?
所以我想要做的是让应用程序自动填写表格,我的形式有几个字段:时间(昨天),位置(麦克唐纳),成本(10个美元),类型(食品)。在这里,“类型”字段将包括食物,购物,运输等。
我已经使用了单词拆分库将句子拆分成几个部分并解析它,所以我已经可以提取时间,位置和成本从用户的声音领域。
我想要做的是用某种机器学习模型推导出“类型”字段。所以应该有一些记录提前,用户手动输入来训练模型。在训练之后,当新记录进入时,我首先提取时间,位置和成本字段,然后根据模型计算类型字段。
但我不知道如何表示位置字段,我应该使用字典包含许多着名的位置并使用索引来表示位置?如果是这样,我应该使用哪种机器学习方法来模拟这个要求?
你需要检查**自然语言处理**。另见:http://www.nltk.org/book/ch05.html – emeth
@mskimm我已经使用分词库来分割句子,可以获得时间,成本,位置字段,但我不知道我应该如何使用什么机器学习模型来推断“类型”字段。 –
你想寻找信息提取。这是一个序列标记问题---看看条件随机场作为一种技术 –