2015-11-04 23 views
0

我正在使用Python进行情感分析的研究,此刻我对nltk.probability产生了一些困惑拉普拉斯估计与预期可能性估计之间的区别?

拉普拉斯估计与预期似然估计有什么区别? 这两种情感分析研究的适当平滑技术是什么?

下面是从NLTK documentation定义 -

拉普拉斯估计用于生成频率分布上 实验的概率分布。所述 “拉普拉斯 估计” 近似的样品的count Ç从 实验概率与Ñ结果和仓作为 (C + 1)/(N + B)。这相当于为每个分箱添加一个计数,并对所得到的频率分布进行最大似然估计。

预期的似然估计为概率分布 实验用于生成频率分布。所述 “期望似然估计” 近似于 样品与计数Ç的从实验与Ñ结果和 仓作为(C + 0.5)/(N + B/2)的概率。这相当于将每个分箱的计数加0.5,并且得到最终的频率分布的最大似然估计。

回答

0

当存在大量未见过的可能事件时,拉普拉斯技术几乎将所有可能性质量分配给之前未见过的数据。 ELE通过使α变小 - 0.5来补偿这一点,从而将更少的数据分配给看不见的事件。

看看here了解更多详情