应用生存分析减少员工离职:一个实际案例

你在这里:
应用生存分析减少员工离职:一个实际案例

人员流动分析是人力资源中经常被提及的话题。然而,关于如何做到这一点并没有太多的文章。在本文中,我们将使用真实数据集解释最常用的离职分析之一,生存分析。

注意:本文需要对生存分析有最起码的了解。因此,我们推荐以下文章:

这个案例是基于一家呼叫中心公司的真实数据,该公司在俄罗斯有五个分支机构。我们怀疑您了解呼叫中心的具体情况,在那里离职率是一个关键问题。

我们将只使用案例的部分数据,而不会描述整个分析。这篇文章的目的是展示的方法,离职分析的方法,导致我们的见解和建议的管理。

本文以R语言的代码和研究过的数据为特色。我们鼓励您重复分析或将该方法应用于您自己的数据。如果你能分享你自己案件的结果,我将不胜感激。我们希望R中的代码对您有用,我们将很高兴听到您的反馈。

在呼叫中心工作的灵感来自这篇文章-忘掉简历吧,数据决定职业

相关(免费)资源!继续往下读↓

人物分析资源库

下载我们的关键人力资源分析资源列表(90+),将帮助您提高您的专业知识和主动性。您的一站式人员分析!

必要的包:

库(lubridate)
库(生存)
库(ggplot2)

加载数据集(turnover.csv),并申请:

q = read.csv("成交量.csv ", header = TRUE, sep = ", ", na. csv(", "字符串= c(" ",NA))

人力资源指标和报告证书 成为一名HR
报告的专家
掌握数据驱动的人力资源,并学习创建强大的人力资源仪表板
在短短10周内,每周学习4小时。
下载课程大纲

str (q)

我们的案例使用了1785名员工的数据。

变量:

在公司工作的时间

$ event -事件(1 -终止,0 -当前雇用)

$ branch - branch

$ pipeline -招聘来源

请注意,数据已经为生存分析准备好了。此外,雇佣期限以月为单位,精确到小数点后两位,计算公式如下:(解雇日-雇用日)/(365.25 / 12)。

接下来我们来看一下总体的人员流动情况。N.B.的指南如何计算员工流动率,按此连结。

w = coxph(Surv(exp, event) ~ 1, data = q)

绘制你的地图
人力资源领导之路

尝试我们的需求工具,根据你的人力资源职业目标和能力来确定你想要进步的方向。

开始

分位数(survfit(w), conf.int = FALSE)

25 50 75

1.61 3.52 9.12

Visualizingpar(bg = " grey ")

情节(survfit (w),

Xlim = c(0,12), ylim = c(0.0, 1),

Col = c(“红色”),

LWD = 3, xaxt= ' n ', yaxt= ' n ')

轴(side=1, at=seq(0,12,1), cex.axis=1.8)

轴(= 2,= seq(0.0, 1.0, 0.1),拉斯维加斯= 2,cex.axis = 1.8)

abline (v = (seq(0, 12日1)),坳=“黑人”,lty =“点缀”)

abline (h = (seq(0.0、1、0.1)),坳=“黑人”,lty =“点缀”)

很漂亮,不是吗?上面的图表是任何数据分析师的梦想。如上所示,呼叫中心员工平均在公司工作3.5个月。我们也称之为公司的“平均寿命”。

这是关键的一点。根据被解雇员工的简历,你可能遇到过对“平均寿命”的不同定义。只使用被解雇员工的信息会产生偏见,这使得这种方法存在缺陷。

让我来解释一下:假设你雇佣了200名员工。半年后,50人退休。使用标准的分析方法,我们只能计算这50个的描述性统计数据。这是不成立的,因为我们还有150名员工,我们不能说他们会工作多长时间。没有它们,分析将是不准确的。

生存分析可以考虑到那些仍在公司工作的人和那些被解雇的人。

进一步的解释

我们得到了关于公司工作年限的总体概述。现在我们来看看在考虑招聘来源的情况下,人员流动率的差异。首先,让我们来看看每位候选人的来源:

总结(q管道美元)

Cs ea js ref sm

59 68 1286 310 62

  • 公司求职网站
  • Ea -职业介绍所/中心
  • Js -工作网站
  • 参考-推荐
  • Sm -社交媒体

招聘网站似乎占据了很大一部分漏斗,但这在俄罗斯市场并不罕见。

至于分析本身:

K = relevel(q$pipeline, ref = " js ") #

我们将以“工作场所”作为我们的参考级别,因为这是最大的来源。所有其他来源都与之相比。

w1 = coxph(Surv(exp, event) ~ k, data = q)

总结(w1)

电话:

coxph(公式= Surv(exp, event) ~ k, data = q)

N = 1785,事件数= 1004

coef exp(coef) se(coef) z Pr(>|z|)

KCS -0.56725 0.56708 0.19379 -2.927 0.00342 **

Kea -0.79360 0.45221 0.19056 -4.165 3.12e-05 ***

Kref -0.17166 0.84226 0.08693 -1.975 0.04830 *

KSM -0.25787 0.77269 0.16856 -1.530 0.12605

- - - - - -

Signif。代码:0 ' *** ' 0.001 ' ** ' 0.01 ' * ' 0.05 '。' 0.1 ' ' 1

Exp (coef) Exp (-coef) lower .95 upper .95

KCS 0.5671 1.763 0.3879 0.8291

Kea 0.4522 2.211 0.3113 0.6570

Kref 0.8423 1.187 0.7103 0.9987

KSM 0.7727 1.294 0.5553 1.0752

一致性= 0.542 (se = 0.008)

Rsquare= 0.018(最大可能= 1)

似然比检验= 33.22在4 df上,p=1.079e-06

Wald检验= 28.23在4 df上,p=1.12e-05

得分(logrank)测试= 29.17在4 df, p=7.231e-06

为了可视化我们的数据,我们将使用以下代码:

w = coxph(Surv(exp, event) ~ pipeline, data = q)

总结(w)

Plot (survfit(w, newdata=data.frame(pipeline = c(' cs ', ' ea ', ' js ',

' ref ', ' sm '))),

xlim = c (0, 12), ylim = c (0.0, 1), conf.int = FALSE, #Поставьте真的

坳= c(“红”、“蓝”、“黄”、“绿色”、“grey1”),

LWD = 4, xaxt= ' n ', yaxt= ' n ')

轴(side=1, at=seq(0,12,1), cex.axis=1.5)

轴(= 2,= seq(0.0, 1.0, 0.1),拉斯维加斯= 2,cex.axis = 1.5)

abline (v = (seq(0, 12日1)),坳=“黑人”,lty =“点缀”)

abline (h = (seq(0.0、1、0.1)),坳=“黑人”,lty =“点缀”)

Legend (" bottomleft ", Legend =c(' cs ', ' ea ', ' js ',

“裁判”、“sm”),

坳= c(“红”、“蓝”、“黄”、“绿色”、“grey1”),cex = 1.5, lty = 1, pch = " ",

LWD = 4, x.intersp = 0.1, y.intersp = 0.3,文本。宽度= 1,方框。LWD = 0)

我们应该如何解读这些结果?

看看“一般表现”,我们可以看到这不是很高(一致性[1]= 0.542)。取值范围为0.5 ~ 1。在这种情况下,0.5表示不相关,1表示完全相关.因此,0.542是一个非常低的结果。但是请记住,结果仅基于一个变量。

来自公司职业网站的员工的流失风险比来自工作网站的员工低1.76倍(见exp(-coef))。

来自职业介绍所的员工的离职风险比来自求职网站的员工低2.2倍。

被推荐的员工的流失率也比从工作场所招聘的员工低1.18倍。这个发现的p值是0.048。然而,这并不能让我们确定被推荐的人离开公司的风险会降低。

你对结果感到惊讶吗?尤其是关于推荐的那部分?如今,推荐项目得到了很多支持,并经常得到推广。然而,在我们的案例中,推荐计划并没有带来我们期望的结果。

因此,我们有了我们的第一个行动点:建议管理层分析推荐计划,并了解为什么它没有像预期的那样工作。这可能是因为不成比例的推荐奖励制度。

分支机构

让我们仔细看看不同部门的人员流动率:

总结(问分行美元)

第五,第一,第四,第二,第三

70 541 343 690 141

出于保密原因,这些分支机构的名称被删除了。

分析遵循与上面描述的相同的模式,您可以轻松地重现它。结果显示各分支之间存在显著差异。

对于我们的下一步,我们决定查看每个分支中的来源比例。Excel数据透视表是一个很好的工具。

这是一个视觉表现:

记住3理查德·道金斯分公司的离职率最低,其次是4个th,则2nd.我们发现,分支机构经理在招聘政策方面有很大的自由度,上面的图表不仅显示了招聘来源的比例,还显示了经理的态度:通过招聘网站招聘成本很低:只需发布招聘信息,然后等待回应。在引荐计划中吸引人员需要相当大的努力。与就业中心合作也需要花费经理/ HR大量的时间、金钱和精力。

管理建议:

综上所述,建议管理层:

  • 分析推荐计划,了解为什么它没有达到预期的人员流失率降低;
  • 来自职业介绍所的求职者在该公司待的时间最长。因此,从职业介绍所分析候选人,并定义他们的“肖像”,作为从其他来源招聘的参考。例如,作为假设,我们可以说就业中心的求职者素质较低;
  • 分析公司招聘网站的流量,了解为什么它能吸引更多的求职者理查德·道金斯分支;
  • 允许经理的3理查德·道金斯分部将举办一个关于与就业中心合作的研讨会。

[1]一致性,或c指数,是生存分析的一个指标。这个c指数来自Wilcoxon-Mann-Whitney双样本秩检验,是通过选取所有可能的受试者对来计算的,其中一个受试者有反应,另一个没有反应。该指数是应答者具有比应答者更高的预测概率的这种对的比例的人.该指数等于成对的预测生存时间和成对的观察生存时间的一致概率和不一致概率之间的差值,考虑了审查。

要阅读更多关于一致性的信息,请查看Harrel & Frank 's回归建模策略与应用到线性模型,逻辑回归,和生存分析

订阅我们的每周通讯了解最新的人力资源新闻、趋势和资源。

你准备好迎接HR的未来了吗?

在线学习现代和相关的人力资源技能

浏览课程 现在招收