可以说我有以下非常简化的培训和测试观察。机器学习自然语言处理 - 自定义翻译
培训
input: her favourite dog was a huskey and her favourite cat was a leopard
output: dog=huskey, cat=leopard
input: her favourite dog was a beagle and her favourite cat was a lion
output: dog=beagle, cat=lion
input: her favourite dog was a poodle and her favourite cat was a burmese
output: dog=poodle, cat=burmese
测试
input: her favourite dog was a collie and her favourite cat was a moggie
desired output: dog=collie, cat=moggie
- 什么是蟒蛇最好的机器学习的方法,让我有测试输入转换成所需的输出?
- 将这些原始数据用于做出这一预测会涉及哪些步骤?
从该地区的一些研究似乎很多现有的机器学习的包都是围绕分类,回归和聚类(例如http://scikit-learn.org/stable/),而我所要做的是翻译的一种形式。
我也研究了一些NLP软件包,其功能更多地涉及关键字识别,词类型识别和情感分析(例如http://www.nltk.org/)。也有一些翻译包可用,但这些是用于预先存在的语言(http://pythonhosted.org/goslate/)
我认识到,对于这种特殊情况,机器学习是完全没有必要的,但实际上会有更复杂,不同和大量的输入翻译。