0

我想对文档层面进行情感分析。但我试图做情绪分析尼泊尔。所以,我没有任何资源。我不能做朴素贝叶斯分类器,因为我没有任何标签数据,因为没有尼泊尔字网存在,所以我不能做wordnet。我阅读的论文一般都会为其他语言标记数据或senti-wordnet。本地语言情绪分析(尼泊尔语)

我想知道这些事情:

  • 我应该在上述情况下使用哪种方法进行情感分析?
  • 有没有什么方法可以为数据动态生成标签?
+0

情绪分类任务中最重要的成分之一就是数据。我不知道在哪里得到尼泊尔标记的数据,但你应该努力找到它。稍后当你有数据的时候,方法基本上是一样的,你无论如何都将你的特征(单词)转换成整数,这样就没有关系。只需找到训练集。 –

回答

2

由于您没有任何标记的数据,请看看this GitHub回购,随时分叉。

它具有用于Java中的手写识别的神经网络的代码。 Jeff Heaton对我们来说很简单,拥有一个不错的用户界面,你可以训练这个模型来识别尼泊尔人。

而对于情感分析,您可以尝试使用Opennlp,它有一些很好的支持, this blog for Beginner's

另外DL4J是一个很好的Java库深入学习库,可用于情感分析。它有一个很好的Word2Vector实现并且有很多支持。

这些资源将帮助你,任何进一步的疑虑 - 随时发表评论。