python中的线性回归

对于统计模型来说，最简单也最经典的模型要数线性回归模型，它可以满足统计建模的所有标准流程，并且适用范围也非常广。R里面是使用lm函数来做回归，而在python里面有几个包都提供了这一功能，首先介绍sklearn包中的回归函数，然后介绍statsmodels包中的回归函数。前者适合于机器学习中的预测，不需要太多中间结果的观察。后者适合于分析，需要对中间结果，例如系数，残差以及效果做判断的时候使用。

第一步：加载各种包

%pylabinlineimportpandasaspdimportmatplotlib.pylabasplyimportstatsmodels.apiassmfromsklearn.linear_modelimportLinearRegressionfromsklearn.metricsimportmean_squared_errorimportstatsmodels.formula.apiassm

Populating the interactive namespace from numpy and matplotlib

第二步：读取数据并画图

df=pd.read_csv('iris.csv')lmdf=df[['Petal_Length','Petal_Width']]lmdf.plot(kind='scatter',x=0,y=1)

<matplotlib.axes.AxesSubplot at 0x119b1f110>

第三步：使用sklearn包中的函数进行回归

# 建立回归对象linear_sk=LinearRegression()X=lmdf[['Petal_Length']]y=lmdf['Petal_Width']linear_sk.fit(X,y)linear_fit.intercept_,linear_fit.coef_# coef

(-0.36651404521672837, array([ 0.41641913]))

linear_fit.score(X,y)# R2

0.92690122792200369

yhat=linear_fit.predict(X=lmdf[['Petal_Length']])mean_squared_error(lmdf['Petal_Width'],yhat)#MSE

0.04228994631948424

第四步：观察回归效果

plt.scatter(lmdf['Petal_Length'],lmdf['Petal_Width'])plt.plot(lmdf['Petal_Length'],yhat)

[<matplotlib.lines.Line2D at 0x11991a790>]

使用statmodels包的过程和结果，可以使用和R类似的公式实施

linear_model=sm.ols(formula='Petal_Width ~ Petal_Length',data=lmdf)results=linear_model.fit()results.summary()

Dep. Variable:	Petal_Width	R-squared:	0.927
Model:	OLS	Adj. R-squared:	0.926
Method:	Least Squares	F-statistic:	1877.
Date:	Sat, 18 Oct 2014	Prob (F-statistic):	5.78e-86
Time:	18:00:43	Log-Likelihood:	24.400
No. Observations:	150	AIC:	-44.80
Df Residuals:	148	BIC:	-38.78
Df Model:	1

	coef	std err	t	P>\|t\|	[95.0% Conf. Int.]
Intercept	-0.3665	0.040	-9.188	0.000	-0.445 -0.288
Petal_Length	0.4164	0.010	43.320	0.000	0.397 0.435

Omnibus:	5.498	Durbin-Watson:	1.461
Prob(Omnibus):	0.064	Jarque-Bera (JB):	5.217
Skew:	0.353	Prob(JB):	0.0736
Kurtosis:	3.579	Cond. No.	10.3

python中的线性回归

python中的线性回归

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本