0
我试图运行KS检验两个图形 一个是原始数据图(红色),另一种是功法适合Python的KS检验 - 这是为什么P值如此之大
from scipy import stats
stats.ks_2samp(Red.Y, Blue.Y)
其中Red.Y是x的每个点的y值,而Blue.Y是每个x的幂律y值。
Out[210]:
Ks_2sampResult(statistic=0.16666666666666669, pvalue=0.99133252540492101)
它看起来像p值是非常大的,因为图形是不一样的。我可以问一下原因吗?
为Red.Y值是:
(0.03, 0.09] 0.000018
(0.09, 0.16] 0.000019
(0.16, 0.29] 0.000016
(0.29, 0.5] 0.000018
(0.5, 0.77] 0.000018
(0.77, 1.0] 0.000022
(1.0, 1.05] 0.000021
(1.05, 1.5] 0.000022
(1.5, 2.0] 0.000025
(2.0, 3.0] 0.000025
(3.0, 4.0] 0.000024
(4.0, 6.42] 0.000026
Blue.Y的价值观是:
(0.03, 0.09] 0.000017
(0.09, 0.16] 0.000017
(0.16, 0.29] 0.000018
(0.29, 0.5] 0.000019
(0.5, 0.77] 0.000020
(0.77, 1.0] 0.000021
(1.0, 1.05] 0.000021
(1.05, 1.5] 0.000022
(1.5, 2.0] 0.000023
(2.0, 3.0] 0.000024
(3.0, 4.0] 0.000025
(4.0, 6.42] 0.000026
在我看来,红色曲线的值可以从蓝色曲线的相同分布中绘制出来。 KS检验用于测量2个样本是否来自相同的分布。在这种情况下,它们来自相同的分布。 – titipata
谢谢你的回答。但是,如果我对不同的原始数据(红色曲线)和相应的最佳拟合的幂律线(蓝色曲线)尝试相同的方法,则P值可以低至0.3以下。请问这个背后的原因? – bing