我正在做一个项目,使用文本挖掘找出疾病相关基因。我为此使用了1000篇文章。我有大约129个基因名称。实际的数据集包含大约1000个条目。现在我想计算我的方法的精度和回忆。当我做了比较时,在129个基因中,有72个被发现是正确的。所以 精度= 72/129。 这是正确的吗? 现在我该如何计算召回?请帮忙文本挖掘结果的计算精度和召回率
-1
A
回答
0
Wikipedia Article on Precision and Recall可能会有所帮助。 的定义是:
Precision: tp/(tp+fp)
Recall: tp/(tp + fn)
凡tp
是真阳性(它与疾病相关基因,你发现他们),fp
是误报(你发现的基因,但他们实际上没有与疾病有关)和fn
是假阴性(实际上与疾病相关的基因,但您没有找到它们)。
我不太确定你发布的数字是什么。你知道真正与这种疾病有关的基因吗?
你最有可能计算精度:
Accuracy = (tp + fp)/(Total Number)
0
的主要问题是,根据我所考虑的文章可能不包含所有自一个小数据集的最初上市的基因名称。因此,在计算召回量时,不要将分母视为1000,我可以将原始基因数据库与文章进行比较,以查明文献中存在多少最初相关基因。即如果有1000个相关基因,我将在1000个数据集中检查出我正在考虑的数据集中有多少个。如果它是300,我会将分母设置为300而不是1000.这会给召回。
相关问题
- 1. 计算召回和tensorflow的精度
- 2. 命名实体识别的计算精度和召回率
- 3. 计算王数据库的精度和召回率
- 4. 如何使用python计算精度,召回率和F分数?
- 5. lucene中的精确度和召回率
- 6. 测量精度和召回率
- 7. 使用R来计算单词频率的文本挖掘
- 8. 简单的计算R的精度,召回率和F1分数的方法
- 9. 如何计算产生问题的系统的精度和召回率?
- 10. 从计算精度,召回,F1-分数精度 - scikit学习
- 11. 计算超过2级的精度和召回
- 12. 使用torch7计算混乱矩阵的召回和精度
- 13. Tensorflow中多类分类的类精度和召回率?
- 14. F1比Scikit-learn中的精度和召回率都要小。
- 15. rapidminer中的召回和精度
- 16. 精确度,召回率和f值在R
- 17. 什么评估分类器?精确度和召回率?
- 18. UIAlertView如果CCMenuItemFont(文本)挖掘
- 19. 文本挖掘中的R
- 20. 迭代包含命名实体映射的两个文件,并计算精度和召回率
- 21. 中文文本挖掘
- 22. 了解召回值和精度
- 23. 信息检索精度和召回
- 24. 3个不同输出的召回和精确计算
- 25. 的Oracle SQL导航数据挖掘文本挖掘
- 26. 理解cryptocoins挖掘利润计算
- 27. 针对不同群体规模的精确度和召回计算
- 28. [R文本挖掘问题
- 29. stemDocument [R文本挖掘
- 30. 文本挖掘:在Python
感谢您的回复。我昨天清了清,我在下面发布了答案。 – Ansu