有人能给我一个清晰和简单的最大熵分类的定义吗?如果有人能够提供一个明确的比喻,这将会非常有帮助,因为我正在努力去理解。什么是最大熵?
Q
什么是最大熵?
1
A
回答
1
“Maximum Entropy”与“Least Informative”同义。你不会想要一个信息量最小的分类器。它是关于前辈是如何建立的。坦率地说,“最大熵分类”是一个使用时髦词汇的例子。
对于无信息的先验的例子,考虑给定一个六边对象。如果物体被扔掉,任何给定的脸部将出现的概率是1/6。这将是您先前的开始。这是最少的信息。你真的不想从其他任何东西开始,否则你会偏向后面的计算。当然,如果你知道一方会更频繁地出现,那么你应该把它融入你的先验。贝叶斯公式为P(H | E)= P(E | H)P(H)/ P(D) 其中P(H)是假设的先验值,P(D)是和所有可能的分子。
对于缺少单词插入的文本分类,E是给定的文档,H是给定的单词。 IOW,假设是H是应该选择的词并且P(H)是赋予词的权重。
最大熵文本分类意味着:从最少信息权重(先验)开始,并进行优化以找到最大化数据可能性的权重P(D)。本质上,它是EM算法。
简单的朴素贝叶斯分类器会假设先前的权重与单词出现在文档中的次数成正比。但是,这忽略了单词之间的相关性。
所谓的MaxEnt分类器考虑了相关性。
我想不出一个简单的例子来说明这一点,但我可以想到一些相关性。例如,英语中的“失踪”应该给名词更高的权重,但如果朴素贝叶斯分类器的相对频率与给定名词相同,则其可以给动词赋予相同的权重。考虑到缺失的MaxEnt分类器会给名词带来更多的分量,因为它们在上下文中可能性更大。
相关问题
- 1. 最大熵使用的OpenCV
- 2. 现代NLP系统中最大熵模型的位置是什么?
- 3. 什么是最大声级
- 4. 使用rngd后,[hwrng]继续最大熵熵
- 5. “共识”其中最大熵分类
- 6. 最大熵模型和逻辑回归
- 7. 增量最大熵分类器
- 8. Python NLTK最大熵分类器错误
- 9. 自然语言处理的最大熵
- 10. 什么是最大的SQL表大小
- 11. 什么是Resourcestring最大大小和最大数量限制?
- 12. 为什么在反熵协议中出现“熵”这个词?
- 13. 什么是CakePHP最大的网站?
- 14. MKMapView最大的区域是什么?
- 15. 什么是apache的最大url长度?
- 16. 什么是TimeSeriesChart的最大范围值
- 17. log4net,logging,什么是最大的优点
- 18. 什么是最大SMS消息长度?
- 19. LLVM的最大好处是什么?
- 20. 什么是clientUserId的最大长度
- 21. 什么是最低VM预算大小?
- 22. 什么是MySQL表的最大行数
- 23. 什么是MySQL的最佳varchar大小?
- 24. 在去,什么是json.Unmarshall最大深度?
- 25. 什么是KeyEvent.VK_的最大可能值*
- 26. 什么是start_urls的最大尺寸
- 27. Memcached最强大的功能是什么?
- 28. Windows上有什么熵源可用?
- 29. heroku有什么熵源可用?
- 30. 在android中有什么用熵(`/ dev/random /)?