无监督情绪分析

我一直在阅读大量的文章，解释在情绪分析系统真正起作用之前，被分类为“积极”或“消极”的最初一组文本的需要。无监督情绪分析

我的问题是：有没有人企图对“正面”形容词与“负面”形容词进行基本检查，并考虑到任何简单的否定，以避免将“不快乐”归为正面？如果是这样，是否有任何文章讨论为什么这种策略不现实？

2010-10-13 Trindaz

一个classic paper by Peter Turney（2002）只用字说明了如何做监督的情感分析（正极/负极分类）的方法优秀和差作为种子集。 Turney使用其他词的mutual information与这两个形容词来达到74％的准确度。

来源

2010-10-14 13:52:24

这个人得到答案标签。这是一篇非常有趣的文章。 – Trindaz 2010-10-15 12:38:45

我还没有尝试做过未经训练的情感分析，例如你所描述的，但是我的头顶上我会说你是在简化这个问题。简单地分析形容词不足以很好地理解文本的情感;例如，考虑“愚蠢”这个词。独自一人，你会把它归类为负面的，但如果产品评论有'... [x]产品让他们的竞争对手看起来很愚蠢，因为先不考虑这个功能......'那么在那里的情感肯定会是积极的。在这样的情况下，词语出现的上下文肯定很重要。这就是为什么单独使用未经训练的书包方式（更不用说更加有限的形容词）不足以充分解决这个问题。

预先分类的数据（'训练数据'）有助于将问题从试图确定文本是否具有正面或负面情绪从尝试确定文本是否与正面文本更相似或消极的文本，并以这种方式进行分类。另一大问题是情感分析等文本分析常常受到文本特征与领域特征差异的影响。这就是为什么拥有一套好的数据来训练（也就是说，你正在工作的领域内的准确数据，并且希望能够代表你将要分类的文本）与建立一个好东西同样重要系统用来分类。

不完全是一篇文章，但希望有所帮助。

来源

2010-10-13 06:35:03

感谢您的回复华夫饼！我非常感谢所有关于此主题的意见。 – Trindaz 2010-10-15 11:57:27

我试着使用影响词典来发现关键词来预测句子级别的情感标签。考虑到词汇的一般性（非域依赖），结果只有大约61％。该论文可在我的主页上找到。

在一个稍微改进的版本中，考虑了否定副词。整个系统，命名为EmoLib，可用于演示：

http://dtminredis.housing.salle.url.edu:8080/EmoLib/

问候，

来源

2010-10-13 07:33:56 atrilla

感谢您的这款酒吧。它为我进行的测试运行得非常好。 – Trindaz 2010-10-15 12:02:09

大卫，