2013-11-21 106 views
3

如何计算python中非线性曲线拟合的确定系数(R2)和均方根误差(RMSE)。以下代码直到曲线拟合。那么如何计算R2和RMSE?如何计算python中非线性曲线拟合的确定系数(R2)和均方根误差(RMSE)

import numpy as np 
import matplotlib.pyplot as plt 
from scipy.optimize import curve_fit 

def func(x, a, b, c): 
    return a * np.exp(-b * x) + c 

x = np.linspace(0,4,50) 
y = func(x, 2.5, 1.3, 0.5) 
yn = y + 0.2*np.random.normal(size=len(x)) 

popt, pcov = curve_fit(func, x, yn) 

plt.figure() 
plt.plot(x, yn, 'ko', label="Original Noised Data") 
plt.plot(x, func(x, *popt), 'r-', label="Fitted Curve") 
plt.legend() 
plt.show() 
+0

根据这位来自statsmodels开发人员的[post](https://github.com/scipy/scipy/issues/2962),来自'scipy.stats.linregress'的'std_err'实际上是斜率系数。这个值与RMSE不同,它是(残差平方的平均值)^ 0.5,这是一个随自由度而变化的不同值。 – pylang

+0

不,scipy文件说SE是估算的标准误差。 http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.linregress.html#scipy.stats.linregress – Borys

+0

在我提供的链接中,您提供的scipy文档的作者解决了这个定义。他的帖子证实了scipy的SE是斜坡的错误。 – pylang

回答

5

你可以做这样的:

print "Mean Squared Error: ", np.mean((y-func(x, *popt))**2) 

ss_res = np.dot((yn - func(x, *popt)),(yn - func(x, *popt))) 
ymean = np.mean(yn) 
ss_tot = np.dot((yn-ymean),(yn-ymean)) 
print "Mean R :", 1-ss_res/ss_tot 

这直接服用的定义,例如在维基百科: http://en.wikipedia.org/wiki/Coefficient_of_determination#Definitions

+0

快速更正:根据您链接的维基百科页面,您给“平均R”的值实际上是R^2。 –

0

马丁Böschen,不yyn这里:

np.mean((y-func(x, *popt))**2) 

阅读该约根均方误差(RMSE):http://en.wikipedia.org/wiki/Regression_analysis

residuals = yn - func(x,*popt) 
print "RMSE",(scipy.sum(residuals**2)/(residuals.size-2))**0.5 

现在计算为Excel 2003中分析工具库。