日期:
来源:学研录收集编辑:李学研
考察财政收入(t)和国内生产总值(x1),税收(x2),进出口贸易总额(x3),经济活动人口(x4)之间的数量关系,建议多元线性回归方程。
选取B1:F24区域,然后拷贝(Ctrl+C),在R软件中运行以下语句:
y=read.table("clipboard",header=T)
在R软件中,运行以下语句:
fm=lm(y~x1+x2+x3+x4,data=y)
fm
由于自变量与因变量都是有单位的,从数值上来看,它们样本取值的极差会有很大的差异,均数与标准差也各不相同,所以不能由偏回归系数的大小直接说明对因变量线性影响的大小。对于这个问题常用变量标准化与计算标准化偏回归系数的方法来处理。标准化后常数项为0,且各变量的标准差相同,可用偏回归的系数的值来反映各自变量在其他自变量固定时对因变量线性影响的大小,相互之间可进行比较。
常用的统计软件都能给出标准化偏回归系数,但R语言中并不包含计算标准回归系数的函数。因此需要自编。
2、双击用R软件打开“mvstats.R”,“Ctrl+A”全选,单击“Run”运行代码其中的代码。
3、运行coef.sd(fm),由标准化偏回归系数可见,税收对财政收入的线性影响最大。
coef.sd(fm)
利用Summary()函数进行回归方程的假设检验。
summary(fm)
其中,系数的t值和p值,系数的显著性检验;方程的F值和p值,方程的显著性检验。
模型的p<0.0001,故本例回归模型是有意义的。
可认为国内生产总值x1和进出口贸易总额x3对财政收入y没有显著的影响。我们可以看到,国内生产总值、经济活动人口所对应的偏回归系数都为负,这与经济现实是不相符的,出现这种结果的可能原因是这些解释变量之间存在高度的共线性。
new<-data.frame(x1=30,x2=40,x3=50,x4=100)
lm.pred<-predict(fm,new,interval="prediction",level=0.95)
lm.pred
其中,fit为预测值,lwr是95%下限,upr是95%上限。