你好我得到了信息检索的任务,我不能知道如何创建一个部分规范,我的意思是像这里的字的值:http://nlp.stanford.edu/IR-book/html/htmledition/finite-automata-and-language-models-1.htmlParticial规范
的= 0.2
a = 0.1
青蛙= 0.01 ...等等。如果有人解释如何计算这些值,我会很感激。
了解语言模型!
a)解释这个想法!
b)考虑下面的文档集合:
D1:今天是晴天。晴朗的柏林!生存还是毁灭。 D2:她今天在柏林。她是个阳光明媚的女孩。柏林总是令人兴奋!
为每个文档计算相应的Unigram语言模型!假设 停止概率在模型之间进行固定(并且等于0:2)。使用这些模型 排名给出的查询\晴天柏林“的文件!