任何人都可以帮助我统计计算F-measure吗?我知道如何计算召回和精度,但不知道给定的算法如何计算一个F-measure值。计算聚类的F-measure
作为为例,假设我的算法创建米集群,但我知道有ñ集群为相同的数据(如由另一基准算法创建)。
我找到了一个pdf,但没有用,因为我得到的集合值大于1. pdf的参考是F Measure explained。具体来说,我已经阅读了一些研究论文,其中笔者根据F-measure对两种算法进行了比较,他们将0到1之间的值集中在一起。 如果仔细阅读上面提到的pdf,公式为F(C,K )=Σ| ci |/N * max {F(ci,kj)}
其中ci是参考簇& kj是由其他算法创建的簇,在这里我从1运行到n & j从1运行到m.Let say | c1 | = 218这里按照pdf N = m * n假设m = 12和n = 10,并且对于j = 2我们得到了最大F(c1,kj)。当然,F(c1,k2)介于0和1之间,但通过上述公式计算的结果值我们将得到高于1的值。
你可以发布你的召回和精度? IINM如果他们介于0和1之间,他们的平均值(请参阅您的参考)应该<1(请检查您的公式)。如果他们不是,你的算法很可能是错误的。 –
是的,请详细说明您如何获得精确度和召回率。他们必须在0到1才有意义。否则,F1也会走出界限。你可能有*重叠*集群?然后它不会工作;而且我不知道确实允许评估重叠群集的扩展。 –
我认为这是指:http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html –