回归分析的总结
下面是好好范文网小编收集整理的回归分析的总结,仅供参考,欢迎大家阅读!
相信很多人也有这样的疑问,既然都是研究变量间的关系,已经进行过相关分析为什么还要使用回归分析呢?
其实,相关分析与回归分析的研究目的并不相同。相关分析用于描述变量之间是否存在关系,而回归分析则是研究影响关系情况,反映一个X或者多个X对Y的影响程度。
相关分析只能研究变量之间相关的方向和程度,却不能得到变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,而这些都可以通过回归分析得出。
因而分析时首先应该确定研究变量之间是否存在关系,即先进行相关分析。当两个变量之间存在显著的关联时,再进行回归分析。有了相关关系,才可能有回归影响关系,如果没有相关关系,那么也不应该有影响关系。
清楚了相关与回归的区别,我们开始正式介绍今天的主角——回归分析
01 回归分析概念
回归分析用于研究变量之间的影响关系情况,同时也可用于估计与预测。比如,分析消费者对某产品购买意愿的影响因素;或者研究员工敬业度与工作绩效之间的关系;也或者根据学生以往的成绩进行成绩预测等。
02操作步骤
案例:为研究在线学习课程满意度的影响因素,收集300份数据,将平台交互性、教学资源、课程实施、课程设计共四个因素作为自变量,将学生满意度作为因变量,利用回归分析方法进行分析(涉及题目均采用李克特五级量表)。
首先,通过相关分析已经得出平台交互性、教学资源、课程实施、课程设计共四个因素与满意度均有着显著的正相关关系。因此,将4个变量均纳入模型分析。
SPSSAU分析界面
这里可以选择是否保存残差和预测值,可用于检验回归模型构建情况和预测分析
如果X为定类数据,直接放入模型时,一般是不会对其进行分析,而仅仅是作为控制变量纳入模型。如果想对其进行分析,则需要进行虚拟变量设置。(设置路径:数据处理→生成变量→虚拟变量)
03 结果分析
线性回归结果
第一步:首先对模型整体情况进行分析
包括模型拟合情况(R²),是否通过F检验等。
由上图可知,模型R²值为0.402,意味着平台交互性,教学资源,课程设计,课程实施可以解释学生在线学习课程满意度的40.2%变化原因。回归模型通过F检验(F=49.628,P<0.05),说明至少一个变量会对满意度产生影响关系。
第二步:分析X的显著性
分析X的显著性(P值),如果呈现出显著性,则说明X对Y有影响关系。如果不显著,则应剔除该变量。
可以看到,四个解释变量对满意度的显著性分析P值均小于0.05,说明X对Y均有显著性影响关系。
第三步:判断X对Y的影响关系方向及影响程度
结合回归系数B值,对比分析X对Y的影响程度。B值为正数则说明X对Y有正向影响,为负数则说明有负向影响。
通过回归系数来看,模型中四个解释变量的B值分别为0.110、0.150、0.271、0.079。说明平台交互性,教学资源,课程设计,课程实施对满意度均呈现出显著的正向影响关系。
第四步:写出模型公式
模型公式为:满意度=1.600 + 0.110*平台交互性 + 0.150*教学资源 + 0.271*课程设计 + 0.079*课程实施
第五步:对分析进行总结
SPSSAU也会提供智能分析建议,方便分析人员快速得出分析结果,具体分析如下:
SPSSAU智能分析建议SPSSAU智能分析建议
04 其他指标说明
(1)VIF值:用于检验模型共线性问题。
如果全部小于10(严格是5),则说明模型没有多重共线性问题,模型构建良好;反之若VIF大于10说明模型构建较差。如果出现多重共线性问题,可使用使用逐步回归分析/岭回归分析或者进行相关分析,手工移出相关性非常高的分析项。
(2)D-W值:用于检验变量自相关性。
一般在2附近(1.7~2.3之间),则说明没有自相关性,模型构建良好,反之若D-W值明显偏离2,则说明具有自相关性,模型构建较差。
(3)残差正态性:用于检验模型构建情况。
使用“正态图”检测残差正态性情况,如果残差直观上满足正态性,说明模型构建较好,反之说明模型构建较差。如果残差正态性非常糟糕,建议重新构建模型,比如对Y取对数后再次构建模型等。
使用路径:SPSSAU→可视化→正态图
(4)异方差性:将保存的残差项,分别与模型的自变量X或者因变量Y,作散点图,查看散点是否有明显的规律性,比如自变量X值越大,残差项越大/越小,这时此说明有规律性,模型具有异方差性,模型构建较差。
使用路径:SPSSAU→可视化→散点图
上图是回归分析保存的残差值与自变量作散点图,用于检测异方差性,上图可以看出,X变化时,Y并不会变大或者变小,因而说明无关联性,也即说明没有异方差性。
05 其他说明
(1)如果回归分析出现各类异常,可通过比如描述分析、箱线图、散点图等查看数据中是否有异常值,找出异常值,并且处理掉异常值。也或者使用稳健回归(Robust回归进行分析,Robust回归是专门处理异常值情况下的回归模型)。
(2)在进行相关分析时,不需要特别区分自变量X(解释变量)和因变量Y(被解释变量)。但在做回归分析时,首先要确定X和Y,有时由于问卷没有设计对应的问卷题项(比如上面的满意度对应题目),那么建议可以将X所有题项概括计算平均值来表示Y。
好了,到这里一份完整的回归分析就完成了。
怎么样,读过这篇文章,以后再遇到回归分析,你是不是也可以轻松应对呢。