分析技术:回归分析

你在这里:
分析技术:回归分析

回归分析是数据分析中最常用的模型之一。在这篇博客中,我必威 官方网站将通过一些实际的例子和现实生活中的商业案例来解释回归分析是如何工作的。

最小二乘

回归分析是如何工作的?要理解这一点,您需要理解的概念最小二乘最小二乘是一种减少曲线与其数据点之间距离的技术,如下面的示例所示。

杰克在20岁的时候把他的工资记录在一张纸上,每5年重复一次。这是杰克20年后的工资曲线图:

hranalytics-scatterplot-least-squares
在这个简单的散点图中,你可以看到杰克20岁时赚了2500美元,而现在,在他40岁时,他赚了4700美元。

当40岁的杰克想要预测他45岁时能挣多少钱时,最简单的方法是画一条横过图表的第一点和最后一点的线,就像这样:

regression-scatterplot-with-line

相关(免费)资源!继续往下读↓

人物分析资源库

下载我们的关键人力资源分析资源列表(90+),将帮助您提高您的专业知识和主动性。您的一站式人员分析!

这条线似乎符合模型,使杰克能够大致估计出他45岁时能挣多少钱。

最小二乘技术计算所有数据点之间的平方距离。例如,Jake的估算线和25岁、30岁和35岁时的数据点略有不同,分别相差230美元、120美元和380美元(蓝色箭头)。要找到至少平方,你需要计算平方和这一行的:

2302+ 1202+ 3802= 211700

下一个目标是找到至少方格。通过拟合这条线,使之更接近这五个数据点平方和将更低,回归线将有更好的拟合。事实上,最合适的应该是平方和192000股。通过使用SPSS, R或Excel等软件,我们可以做出这样的估计,并产生一条最符合数据的线。这条线是这样的:

regression-line-least-squares

在这个模型中,各个数据点和直线之间的距离处于最低点。换句话说,这条线有最小二乘

线性回归分析

在前面的例子中,我们使用了最小二乘技术来创建一条线性曲线。这种技术是线性回归中最常用的技术。

回归是两个变量之间关系的度量。在Jake的例子中,我们使用了一条线性曲线(一条直线),因此是线性回归。

使用这条回归线,我们可以估计出我们期望杰克在给定年龄挣多少钱。Jake的回归线有如下公式:

支付= 320 + 112 *年龄

换句话说,当杰克20岁时,回归公式估计他将赚:

绘制你的地图
HR职业路径

根据你的人力资源职业目标和能力,确定你想要进步的方向。试试我们的新工具。

开始

320 + 112 * 20 = 2,560美元

这与他2500美元的实际收入非常接近!在45岁的时候,杰克大概可以挣5360美元。

边注:回归曲线并不总是线性的。您还可以应用指数线、对数线或其他类型的线来适合您的数据。你甚至可以在Excel中很容易地做到这一点!请看下面的简短解释视频。

逐步回归分析

在我们之前的回归分析中,我们只使用“年龄”变量来解释工资的增长。逐步回归是一种通过逐个添加多个不同变量来建立回归模型的技术。

当添加一个新变量时,您会期望模型的解释力会增加。如果没有发生这种情况,则该变量没有增加更多的解释力,因此可以省略它。

有不同的技术可以应用逐步回归,但我们将关注最简单的形式:简单的逐步回归。

几年前,我为荷兰一家大型律师事务所做了一项研究,以找出是什么推动了内部创新努力。我获得了人们的创新行为、性别、年龄、敬业度的数据,以及他们对自己职业自我管理的打分。职业自我管理衡量的是员工管理自己职业生涯的积极程度。职业生涯自我管理的特点是在公司内部提高知名度的行为,以及在公司外部与他人建立关系网的行为。这些行为对你的事业发展非常有益。

在下一个模型中,我将逐个(逐步)添加这些变量。

模型
B 意义
1 性别 -0.72 0.00
2 性别 -0.48 0.03
职业生涯自我管理 0.67 0.00
3. 性别 -0.49 0.03
职业生涯自我管理 0.66 0.00
订婚 0.08 0.43

左栏显示了三个不同的模型。的性别职业生涯自我管理而且订婚变量逐步添加到模型中。的B列是非标准化beta系数(它显示了效果有多强:越高越好)和意义列表示显著性水平(小于0.05的数字通常被认为是显著性的)。

正如你在模型1中看到的,性别是创新的一个高度显著的预测因子——显著性水平为0.00,这意味着性别是创新行为的一个有效预测因子。

模型2中增加了职业生涯自我管理(CSM)。CSM比性别更能预测创新行为。注意,当加入CSM时,性别的影响略有降低,因为CSM解释了一些创新行为中的差异,而性别在没有加入CSM时解释了这些差异。

然而,当将Engagement加入到模型3中时,它并没有太多的解释价值,也不显著。这意味着高敬业度并不会让这些员工有更多的创新行为。

通过分析,该公司了解到,为了更具创新性,他们必须雇佣那些更积极地管理自己职业生涯的人。这些人愿意推动他们正在从事的项目,他们是活跃的网络工作者,这对建立新的和创新的想法非常有帮助。该公司还了解到,花钱提高用户参与度是明智的这是提高创新力的有效措施。

当然,在评估具有多个变量的回归模型时,还有一些标准需要考虑。可以这么说,通过这张表格,我们可以看到参与度目前并不能帮助我们解释创新行为。

有趣的事实不是。1:我预计年龄会影响创新行为,因此我在模型1中加入了年龄和性别。然而,年龄被自动从模型中删除了,因为它一点也不重要!

有趣的事实不是。2:性别在很大程度上解释了创新行为的差异,男性报告的创新行为比女性更多。Millward和Freeman(2002)也发现了类似的效应。在他们的研究中,女性将受到批评的风险、某个特定想法得不到认可的风险以及失败的风险视为创新的障碍——而男性则没有报告这些风险。

此外,这家律所还表现出了老男孩关系网的特点:该律所的大多数合伙人都是男性。这些合伙人拥有更大的权力,因此可以自由地从事创新工作,而年轻人(其中大多数是女性)则不太能这样做。

在Excel中逐步回归已经非常困难了。R或SPSS这样的工具对这项技术更实用。

我希望你喜欢这个回归分析的简要概述。当然,除了我在这篇文章中所写的内容,还有更多的内容,但我相信,了解一项技术的基础知识将帮助您理解数据驱动的人员分析的力量和潜力。

现在你知道了回归分析的基础知识,你应该看看我们的关于人力资源度量的文章:它可能会给你一些关于如何关联和分析不同指标的新想法。

参考

明沃德,L. J. &弗里曼,H.(2002)。角色期望对创新的制约:女性管理者的案例。传播研究杂志,14(1), 93 - 109。

订阅我们的每周通讯了解最新的人力资源新闻、趋势和资源。

你准备好迎接HR的未来了吗?

在线学习现代和相关的人力资源技能

浏览课程 现在招收