2015-11-05 61 views
0

什么是使用情感评级词典来计算情绪的实际公式。我正在使用的词库包含范围-5到5之间的评分。我想计算个别句子的情绪。要么我必须计算句子中所有情感排序词的平均值,要么只是总结它们。什么是情绪计算公式

回答

5

有几种方法可以根据句子的评分情感成分计算索引。每个都是基于比较正面和负面的话,每个都有优点和缺点。

对于您的量表,衡量单词中心倾向的衡量标准将是一个公平的衡量标准,其中分母即为得分单词的数量。这是下面采用的“相对比例差异”度量的一种形式。您可能不希望将所有情感词的分数除以所有词,因为这会使每个句子的度量受到非情感词的强烈影响。

如果您不相信您所描述的11分评级是准确的,您可以根据其符号将其分为正面或负面。然后,你可以应用以下方法,你已经改变了 其中每个Pñ指正负编码情绪词的计数和Ø是所有其他词的计数(使总字数= P + N + O)。

  1. 绝对比例差异。边界:[0,1]

    情绪=(P - Ñ)/(P + Ñ + ö

    缺点:一个句子的得分是由非受影响情绪相关内容。

  2. 相对比例差异。边界:[-1,1]

    情绪=(P - Ñ)/(P + Ñ

    缺点:一个句子的分数可能趋向于靠近非常强烈地聚集(因为它们可能包含主要或唯一的正面或负面的内容)。

  3. Logit scale。边界:[-infinity,+∞,

    情绪=日志(P + 0.5) - 日志(Ñ + 0.5)

    这趋于具有最光滑的性能,是围绕零对称。 0.5是更平滑的以防止日志(0)。

有关详细信息,请参阅William Lowe, Kenneth Benoit, Slava Mikhaylov, and Michael Laver. (2011) "Scaling Policy Preferences From Coded Political Texts." Legislative Studies Quarterly 26(1, Feb): 123-155.我们比较它们的性能测量左右的意识形态,但我们还讨论了一切适用于正负情绪。

+0

绝对比例差异,(1)/N_? – salvu

+1

正确 - 分母N表示所有单词,而其他地方表示否定。我会纠正的。 –