分析学中的统计:简介

你在这里:
分析学中的统计:简介

“要了解上帝的思想,就必须学习统计学,因为统计学是他在宇宙中目的的衡量标准。弗洛伦斯·南丁格尔

作为我职业生涯早期的一名统计学讲师,我知道统计学有多无聊(对我们大多数人来说)。然而,掌握统计学的基础知识对于你成为一名成功的人力资源专业人士是至关重要的。没有它,你就无法利用数据科学为人力资源提供的巨大潜力。

在这篇文章中,我将通过讲故事来解读人力资源统计数据。我将回答19个通常由即将开始分析之旅的年轻商业和人力资源经理提出的问题。

问题1:你如何定义人力资源分析?

分析是“分析”和“统计”这两个术语的组合。它指的是通过应用统计学进行的任何分析。人力资源分析是应用于人力资源领域的分析。这些分析可以是高级预测分析,也可以是基本的描述性统计。这意味着人力资源分析是一种数据驱动的管理工作人员的方法(Gal, Jensen & Stein, 2017)。

问题2:那么统计学是如何帮助人力资源的呢?

人力资源的世界,以及一般人,都是非常随机的。统计数据有助于理解、捕捉和预测我们世界的随机性。它可以通过估计不确定性来降低风险,并揭示日常人力资源流程中隐藏的方面。例如,使用分析,你可以预测谁最有可能离开组织,估计你是否公平地奖励不同的员工,并发现招聘过程中的偏见。如果没有它,你就会错过很多有价值的信息,而这些信息是做出更好的人事决策所必需的。

总是有某种形式的统计数据来拯救我们!

相关(免费)资源!继续往下读↓

人物分析资源库

下载我们的关键人力资源分析资源列表(90+),将帮助您提高您的专业知识和主动性。您的一站式人员分析!

问题3:听起来统计分析是所有人力资源问题的解决方案!

我们希望如此。不幸的是,统计建模只能解释部分问题。我们生活的世界并不完美。与直接计算的理论数学不同,统计学是关于概率的。

统计模型总是受到被称为噪声和固有误差的不可识别因素的影响。噪音和误差使我们的预测不那么确定。话虽如此,一个好的统计模型将是无价的,有助于做出更好的人事决策。
不确定性并不坏。他们是我们所做的一切的一部分。统计学的应用将不确定性降低到最低限度。这为人力资源提供了一个强大而准确的决策支持系统。

问题4:除了噪声和误差,人力资源统计在应用中还有什么缺点吗?

是的,偏见!偏差在任何统计分析中都是一个重要因素。这可能是由于采样不当、信息选择性差,甚至完全缺乏足够的数据。
举个流行的例子,一个学生在比赛中获得了第三名。干得好,孩子!然而,比赛只有3人参加。也许这毕竟不是一个出色的表现。这是选择性信息的一个例子,可以通过收集更多信息来解决。
在现实世界中,抽样偏差可以注入大量的选择性信息。它甚至可以被故意设计为有利于既得利益方,而不是代表事实。这和编造财务记录的会计师没有太大区别,不是吗?
人力资源分析统计

问题5:到目前为止,一切顺利。现在,你能在不使用代数的情况下,用真实世界的类比来揭开统计学的神秘面纱吗?

好了,游戏开始!
统计学只有三个核心部分,仅此而已。这三个火枪手(单独或组合!)可以解决太阳下任何数据驱动的人力资源解决方案!

这三个部分是:

  • 描述性统计
  • 推论统计
  • 统计建模

问题6:我们需要分别学习这三个吗?

不,他们是连在一起的!让我通过一个现实世界的类比来澄清这三点:

想象一下,我们俩都进入一个体育礼堂,发现中间有一个篮子,里面有4个体育用球。在这个例子中,有两个网球,一个排球和一个足球。我们可以把它称为数据集。

人力资源统计——排序问题

现在我们两个人的任务是根据球的周长来分组。当然,我们不会观察彼此的分组。

我根据周长分为两类:
人力资源统计:置信区间 我把它们放回篮子里了。你重复我的练习,根据周长确定3组。
HR统计置信区间 当我们把球按周长分组时,我们都无意中使用了描述性统计。然后,我们将分组与球的总数进行比较,并给出我们唯一的解决方案。然而,重要的问题是:为什么我们对它们进行了不同的分组?

这就是推论统计学的本质。

问题7:好吧,我们中有人分组错了吗?

不,这就是推理统计学的魅力所在。我们俩都是对的,只是我们的推论略有不同。足球周长是排球周长的98%。

来自人力资源业务伙伴
对CHRO

规划好你的HR职业道路。尝试我们的需求工具,根据你的人力资源职业目标和能力来确定你想要进步的方向。

开始

对我来说,这2%的大小差异似乎微不足道。因此,我将他们分配到同一组。对你来说,2%的大小差异似乎很重要,这让你把两个球分配给两个不同的组。

看看我们在英语会话中是如何使用“意义”和“推论”这两个词的吧?这些术语适用于任何统计分析的主干。

问题8:所以,这种差异对我来说很重要,但对你来说不是。意义只是个人的心血来潮,不是吗?

啊哈,这只是部分正确!即使同等重要程度的决定也会改变。怎么做?让我们再深入挖掘一下,看看置信度的概念是从哪里来的。

比如说,足球和排球不是只有一个,而是每一种都有10个球。然后我们需要取10个单位的平均周长(两种类型的球)。现在10个足球的平均周长是10个排球的平均周长的99%。从98%升级了,不是吗?

在这里,1%的大小差异对我们双方来说都是微不足道的。因此,我们将两个球分配给同一组。看到我们的决定随着样本量的增加而改变了吗?值得注意的是,我们对更大样本量的推断也更有信心。置信水平是统计学中常用的一个重要术语。

统计卡通 有统计学意义的异常值

最后,让我们平均每一种球100个单位。现在足球是排球的平均周长的100%。现在,即使是我们当中最怀疑的人也不会怀疑足球和排球的周长是相同的。

这简单地解释了统计数据。这都是关于推论水平(可以定制),以及我们如何对样本量越大的推论更有信心。

问题9:如果是这么简单,为什么我们需要指标来计算p值、显著性水平、置信区间、方差分析等等?

为什么统计计算要复杂得多,有两个根本原因

  1. 与我们前面的例子相比,在大多数现实生活中的流程(包括HR)中,各个单元之间的差异要大得多。
  2. 我们测量的是两组球之间的差异,而不是单个球之间的差异。与人力资源相关:我们衡量的是两个招聘团队之间的差异(而不是单个招聘人员之间的差异)。

在我们前面的例子中,足球和其他类型的球在制造过程中经历了严格的质量控制。这导致它们的变化最小。然而,人在“制造”过程中并没有经过“严格的质量控制”。人们更加多样化,每个个体单位之间的差异也更大。

然而,这两个例子都近似于现实生活中的正态分布。

问题10:好吧,我以前听说过这个,但到底什么是正常?

让我们把足球类比到另一个维度,利用它的形状。现实生活中的流程分布(如每个员工的生产率,或每天的旅行距离)在图表上以不同的形状表现出来。然而,由于分数倾向于保持平均水平,所以它们总是遵循相同的模式。它们的形状更像橄榄球。

为了最简单的解释,我们来看看沙漏。
人力资源分析中的统计-正态分布

从玻璃中落下的细小颗粒在大小和重量上都有微小微米的差异。然而,金字塔总是遵循一个近似的正态分布,一次又一次(双关语)。类似于半个橄榄球。这意味着不同单位之间的方差模式自然被期望在一定范围内。

对于正态分布的另一种解释,看看这个精彩的YouTube剪辑。点击视频开始-虽然它看起来是灰色的,但它是有效的!

这正是现实生活中大多数数据的样子。然而,有些过程更像是暴风雨海上航行中的沙漏。以绩效评级为例。这些数据偏向一边,因为经理们不喜欢给员工低评级。这些不是正态分布。当人们得分相同时,很难区分他们,这就是为什么统计学的核心问题之一是测试是否正常。下图显示了倾斜的性能分布和平均值(平均值)、中位数(中间的值)和众数(数据集中最常见的值)。

每次我们分析数据时,我们都需要检查我们的人力资源数据是否遵循平静海面上的沙漏状分布。

问题11:那么,这仅仅意味着在正态分布中,方差必须在可接受的范围内吗?

完全正确。完美正态分布意味着66.6%的数据集位于均值的2个标准差范围内,99.7%位于均值的3个标准差范围内。标准差是一种离散度的度量,类似于测量一个橄榄球从它的中心到宽度的方差。
如果我们的人力资源数据密切遵循正态分布的形状,我们可以确信任何统计推断都将具有良好的准确性度量。

问题12:那么,如果我们的橄榄球——抱歉,是人力资源数据——不正常呢?可靠的统计分析就此终结了吗?

不,没有正常并不是不正常。这里有一个可行的妥协方案;我们可以用中位数代替均值。中位数是类似于平均值的中心性估计。我们可以使用非参数方法来执行统计分析,但结果在现实场景中被吹捧为不那么可靠。

然而,作为一名统计学家,我觉得非参数方法是统计学中最简单和未被充分利用的方面之一。

无论如何,在统计分析中还有其他技巧可以使用。就像box-cox转换去除异常值(强制回归正常)等。然而,这稍微超出了本文的范围。请记住,任何统计分析都有漏洞!

问题13:我想我对统计学的能力和局限性有了一个广泛的概述:正态分布、方差和统计推断。你能给我一个真实的人力资源正态分布的例子和它的统计分析吗?

确定的东西!让我们给橄榄球拍两张一模一样的照片。然后,把它打印出来两张,在两张图片上随机加100个点(大致覆盖图像的整个表面)。这两个橄榄球的图像是一样的,但两个球上的圆点图案却不一样。
分析中的统计-比较群体
为什么?在两个橄榄球上随机的100个点中,许多点距离图像中心的距离是不同的(平均值)。因此,如果不测量所有点的距离,就很难判断整体的差异。

现在,将2个橄榄球图像替换为HR中全球招聘中心的2个招聘团队。每个图像,或全球招聘中心,有100名招聘人员。将随机点替换为每个招聘人员的招聘业绩。

橄榄球的确切中心代表了每支球队的平均表现。两支球队的表现一样吗?这是同样的情况。同样的橄榄球。同样的100个招聘人员。总面积是一样的。然而,由于这些点在橄榄球上的分布不同,所以整体表现不一定相同。

问题14:所以两支球队的表现不一定相等。这意味着新兵个人的表现成为关键。

是的,完全正确!而不是只有一个因素(均值),我们现在有两个因素(均值和方差)是重要的。

均值与方差的比较是统计学的灵魂。

均值(所有招聘人员表现的平均值)和方差(每个招聘人员与均值的距离)。掌握了这两个概念,就掌握了应用统计学的90%。我的意思是它(双关语)!

统计学中的所有假设检验,包括t检验、方差分析、卡方检验等,取决于以下公式:

    1. 平均值或中位数(所有招聘人员表现的平均值)。
    2. 方差(每个招聘人员与平均值的距离)。
    3. 总体数量(招聘人员的样本,即n)。

在某些情况下

  1. 来自z分布表(预先计算的正态分布表)的值。

这就是全部!如您所见,这将所有统计数据分解为4个最低分母。

问题15:太棒了!我们通常需要对人力资源数据进行所有这些测试吗?

确切的测试将取决于业务所需的洞察力类型。一个典型的起点是t检验或方差分析。ANOVA的字面意思是方差分析。这两者都检查了两组之间的平均值是否有显著的整体差异,例如两个HR招聘团队。

问题16:我们可以对招聘人员的表现数据做一个t检验吗?

当然。我们从数据中选择一个样本集。假设每个团队中有30名招聘人员(满分100人)的表现。当然,这些都是随机选择的,以消除任何偏见。
现在我们有了平均表现(样本和总数)和方差方面的数据。这就是我们需要的全部数据。
我们应用t检验公式。这是一个关于均值,方差和招聘总数的线性代数杂耍。我们将在下一篇文章中解释公式背后的逻辑:

Z公式

通过手工计算(使用基本计算器)大约需要12分钟,使用统计分析软件或Excel宏只需几秒钟。

现在输出可能是这样的:t = -3.73, p = .07。

t值是t检验的结果。P代表概率。在这种情况下,我们的发现是随机的概率是0.07(7%),而这些发现是真实的概率是93%(不是由随机或偶然引起的)。

基于同一份报告,我们仍然可能对我们的假设得到不同的答案。为什么?

因为我们对t检验p值的“差异显著性”的理解不同。换句话说,你的p值显著性标准小于。10,而我的显著性标准小于。05。

我们测试的p值是。07。

让我们比较一下测试的p值与我们个人的显著性水平:

  • .07 > .05(我的重要价值)
  • .07 < .10(你的重要性值)

在你的例子中,测试的p值低于你的显著性值。这意味着,根据你的说法,两组之间的平均值有显著差异。

在我的例子中,测试的p值高于我自己的显著性值。因此,我认为这两组之间没有显著的差异。

p值表示两组之间的差异来自随机机会的概率。也就是说,两组之间没有实际的区别。在我们的例子中,两组之间的差异有7%的几率是由于偶然造成的。这足以让你得出结论,两组之间存在显著差异。我有更高的标准,因此不认为这种可能性低到足以得出同样的结论。

问题17:如果我们增加样本量会发生什么?

有趣的是,如果我们将样本容量从30改变为100,p的值增加到。15。这将意味着根据我们的两个推断,两个团队之间的表现没有差异。

  • .15 > .05(我的意义值)
  • .15 > .10(你的重要价值)

正如你所看到的,推论(决策)随着样本量的变化而变化。

问题18:其他方面呢,比如置信区间?

置信区间越窄,我们对自己的分析就越有信心。如果我们的数据集遵循正态,那么它的宽度应该与样本量成反比。这遵循中心极限定理。在下一部分中,我将介绍这一点以及统计测试的其他关键方面。这一部分只是对应用统计学的学科及其与人力资源的相关性进行了概述。

人力资源统计漫画

问题19:我在哪里可以了解更多关于人力资源的统计信息?

这是个好问题!我们专门开设了一门课程人力资源统计.在本课程中,我们将涵盖多个主题,分为四个模块。

  1. 统计学概论
  2. 方法
  3. 基本统计检验
  4. 高级统计检验

模块1,你将了解静态数据如何影响你的日常生活,以及它如何帮助我们在人力资源方面。您将学习一些简单的技巧来更好地理解数据,如平均值、众数、中位数和范围。您将了解数据的传播,它如何影响您的数据分析,最后,您将学习清理和可视化数据的技术。前两个模块为第3和第4模块的实际分析做准备。

模块2,你会学到更多关于方法论的知识。统计学和方法论是密切相关的。两者缺一不可。在本模块中,您将学习抽样、偏差、概率、假设检验和概念模型。在准确地分析数据之前,必须了解这些关键概念。

单元3和4,您将学习基本和高级统计测试。我们将从相关分析、t检验和方差分析开始。在第二部分中,您将学习线性回归、多元回归、逻辑回归和结构方程建模。

我们将用一整节课来解释这些测试。我们将解释这些测试是如何工作的,什么时候可以应用这些测试,这些测试的核心假设,我们将把您链接到各种资源,以便在您使用的软件中执行这些测试。

因为这些测试可以使用Excel、SPSS、R或其他统计软件包来完成,所以我们将课程的重点放在一步一步地进行测试的过程上,这与您使用的软件无关。这意味着无论您使用R还是SPSS,您都将拥有进行该测试的所有信息。

准备好将人力资源分析提升到一个新的水平了吗?

人力资源统计学教你基本的统计技能,包括关键概念,如概率和显著性。当你运用这些技能来解决正确的问题时,你将能够创造独特的结果,并在将人力资源数据转化为增值见解方面发挥关键作用。

即使你没有任何处理数字和运行统计测试的经验,这门课程也会让你很快跟上速度。完成后,您将能够快速测试实用的假设,知道何时应用某种类型的统计测试,以及如何解释其结果。

订阅我们的每周通讯了解最新的人力资源新闻、趋势和资源。

你准备好迎接HR的未来了吗?

在线学习现代和相关的人力资源技能

浏览课程 现在招收