统计211

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 6498|回复: 1
打印 上一主题 下一主题

含有虚拟变量的回归分析

[复制链接]
跳转到指定楼层
1
发表于 2016-8-16 16:03:07 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
含有虚拟变量的回归分析
线性是回归分析的重要假设。在进行线性回归分析时,自变量必须是连续变量,如果将一个离散变量纳入预测变量中,则需要将这个离散变量转换为虚拟变量,以使离散变量能够与其他连续变量一同纳入自变量中进行预测。
上次的《虚拟变量》一文中提到,在虚拟变量转换方面,需要用“0”,“1”的方式表示,虚拟变量数等于水平数减1。如果是二分类变量,就用一个虚拟变量表示,此虚拟变量的两个水平数值直接用0、1表示即可。如果该离散变量有3个水平,则应用2个虚拟变量表示。此外分类变量转换为虚拟变量时,关于参照组的设定有学者提出以下几个原则:
(1)        参照组的定义应该非常明确。如果类别变量中的水平内容为“其他”,就不适宜作为参照组,因为“其他”内容的定义不明确。
(2)        分类变量若具有次序尺度(如学历),则有两种选择参照组的方法:一是选择等级最高或最低的类别,二是选择等级居中的类别。前者的方法,可以让研究者有次序地将各个类别的回归系数与参照组进行比较,后者的方法,可以让研究者有效地观察达到水平的系数。
(3)        参照组的样本量应该适中,选择样本观察值过少或较多的水平作为参照组,对于类别中各个水平回归系数的比较不适当。
下面通过一个实际案例采用SPSS来研究虚拟变量的回归分析。案例的部分数据如下图所示:

QQ截图20160816154934.png (183.61 KB, 下载次数: 0)
案例的研究背景:民营上市企业高管薪酬的影响因素研究。其中AREA(公司地区)变量有3个水平,分别为东部、中部、西部。DUAL(董事长与总经理兼任情况)有两个水平,分别为两职兼任、非两职兼任。DEGREE(高管学历)中有5个水平,分别为中专及以下、大专、本科、硕士研究生、博士研究生。
上述三个分类变量转化为虚拟变量的结果如下:
QQ截图20161.png (22.7 KB, 下载次数: 0)
SPSS中将分类变量转换为虚拟变量的操作方法如下:
转换→计算变量→分别输入目标变量和数字表达式→单击确定
QQ截图20160816155208.png (195.79 KB, 下载次数: 0)
QQ截图20160816155249.png (228.2 KB, 下载次数: 0)
QQ截图1.png (230.65 KB, 下载次数: 0)
QQ截图2.png (133.69 KB, 下载次数: 0)
上述图片展示的即为虚拟变量的SPSS设置过程,虚拟变量设置完毕后接着就是采用线性回归分析,将所有连续性变量和虚拟变量全部纳入回归方程得到如下回归分析结果:
QQ截图3.png (7.4 KB, 下载次数: 0)
QQ截图4.png (29.29 KB, 下载次数: 0)
回归分析结果表明,对高管薪酬有显著影响的是公司规模(SIZE),而几个分类变量(AREA、DUAL、DEGREE)对高管的薪酬并无显著影响。
Ocean
2016-8-12



如果您觉得本文不错,欢迎分享转发到朋友圈,谢绝任何形式的转载~
欢迎您邀请朋友关注微信号“统计211网( ID: tj211_com)”!

还可以扫一扫二维码关注我们哦~~



二维码.png.thumb.jpg (26.78 KB, 下载次数: 0)
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


免责声明|关于我们|小黑屋|联系我们|赞助我们|统计211 ( 闽ICP备09019626号  

GMT+8, 2025-4-1 00:15 , Processed in 0.085904 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表