我正在使用Apache OpenNLP进行Yammer对话情绪分析。这里的想法是将每次谈话分类为积极,消极或中性的情绪。对话可以是单个句子或一组句子。使用OpenNLP进行情绪分析
我有2个模型 - 短句分类模型和长句分类模型。短句子分类模型与较短的句子(少于10个字)为2的截止和长句分类模型进行训练较长的句子用5
这里的截止训练有素的是我的做法
- 阅读每个对话。
- 清理它以删除HTTP URL,特殊字符,在点等后添加空格。
- 使用SentenceDetector将对话拆分为句子。
- 对于每个句子调用分类。如果句子短,则称短句分类模型,否则称为长句分类模型。句子分类的输出为正,负或中性
- 总结句子分类的结果。即如果发现更积极的句子,则将对话分类为积极的,否则相应为否定的。
我有几个与此相关的方法
- 做题,我需要两个模型短短的一句话模型和长句模型。我决定这样做的原因是因为短句和长句的截尾不同。
- 可以遵循基于句子的分类模型,然后总结每个句子的结果以获得对话结果。
- 是否有这个问题