0
我必须通过使用n-gram匹配两篇研究论文的标题(仅适用于uni,bi和tri) 我的主管已经问过我相匹配的时候,我必须将更多的权重分配给bigram匹配的词条分数而不是单字符匹配术语得分和更多的权重卦匹配术语得分比双字符匹配术语得分。 例如,两个bigrams在标题匹配,然后得分= 2 和两个tigrams匹配,然后得分= 2 我必须寻找一些值,然后乘以它将增加trigram得分和减少bigram得分 我寻找与这个问题有关的研究论文,但我从那里得不到任何帮助。 :(如何将更多的权重分配给bigram和trigram?
谁能给一些想法或一些链接,可以解决这一问题?
欢迎堆栈溢出。请参加[游览]并阅读[问]一个很好的问题。 –
究竟是什么问题?加权是一个简单的乘法,你的问题可能不是“我该怎么做乘法”。请澄清你的问题在哪里,最好用一些* code *来讨论。 –