0
我正在使用Python进行情感分析的研究,此刻我对nltk.probability产生了一些困惑拉普拉斯估计与预期可能性估计之间的区别?
拉普拉斯估计与预期似然估计有什么区别? 这两种情感分析研究的适当平滑技术是什么?
下面是从NLTK documentation定义 -
拉普拉斯估计用于生成频率分布上 实验的概率分布。所述 “拉普拉斯 估计” 近似的样品的count Ç从 实验概率与Ñ结果和乙仓作为 (C + 1)/(N + B)。这相当于为每个分箱添加一个计数,并对所得到的频率分布进行最大似然估计。
预期的似然估计为概率分布 实验用于生成频率分布。所述 “期望似然估计” 近似于 样品与计数Ç的从实验与Ñ结果和 乙仓作为(C + 0.5)/(N + B/2)的概率。这相当于将每个分箱的计数加0.5,并且得到最终的频率分布的最大似然估计。