2018年9月,当马云宣布由张勇接任董事局主席,众人才开始注意到这位“成功男人背后的男人”,原来是位出身CFO的CEO。
张勇是CFO成功转型的典范,试想一下如果以后财务人的职业规划中有了CEO这样的角色,是不是很激动人心呢?
职业路径是人才发展领域核心的基础模块,在人才发展领域,e成科技基于海量职场数据,设计了整套智能化解决方案,并命名为灯塔(Lighthouse),寓意为职场用户提供个人发展的指引与建议。
背景大起底:学新闻可以去写代码吗?
IT岗人群的专业分布情况并不让人意外,其中有近一半的人是计算机科学、电子信息工程、数学等理工科专业背景,而全市场在职人群专业分布相比之下较为均衡,占比最大的是财务与会计(9.2%),其次是计算机科学与技术,但比例仅占8.5%。
互联网行业职业发展路径探索
现在,我们对IT岗人群背景有了基本了解,我们接下来深入探索他们的职业发展路径。
岗位轮动蕴含的行业转换>
IT的岗位轮动中,有61%是在互联网行业内发生的;仅有39%涉及行业转换,这其中,工业与互联网行业之间的轮动最为高频(约20%),其次是消费品行业,而医药和生活服务业则与互联网行业属性差异较大,之间的岗位轮动较少见。
可见上图近似轴对称,其他行业与互联网之间的转入与转出比例十分相近,互联网行业的规模增长主要取决于自身规模的扩展(即第一份工作就入职互联网的人群),而不是从其他行业的转入。第一部分的入岗年龄统计结果也一致印证了这一点。
职业发展路径图展示>
接下来,我们便来看看IT岗人群的职业发展路径具体长什么样吧。我们结合了丰富的数据挖掘算法和业务规则,运用e成科技独特的职能实体识别技术,从每份简历中提取其职业发展路径(e.g., 软件测试->前端开发->移动开发),最终得到各职能下的高频发展路径,下图为部分IT岗的路径示例。
程序员VS首席技术官(CTO):CTO的差异化特征是什么>
就像上图所示,很多程序员在其职业生涯当中,一直在技术圈中打转,却很难有质的跨越。那王侯将相宁有种乎?取得突破的程序员都有什么特征呢,为此e成君分析了下CTO的表面信息。
从统计结果看,CTO中男性占比近90%,本科及以上学历占82.9%,约26%为计算机相关专业;所需工作年限呈现出右偏分布,主要集中在5-10年之间。可见,学历学校等基本背景并不是让程序员的发展之路产生差异化的主要因素,而且,也并不是工作年限越长越可能成为CTO。那么,是什么影响了程序员的晋升之路呢?
带着这个疑问,我们探索了各职能所需的重要技能列表。我们基于成熟的实体识别技术,得到职能实体及其对应的技能实体列表,再结合多样化数据挖掘和统计方法,得到了多种指标下,各个职能所需的重要技能序列。我们在下表中列举了部分IT岗的所需技能之Top5。
从表格中我们可以发现,不同技术岗所需的重要技能偏向于细分领域的工具或技术知识,特别地,MySQL在程序员中的使用率是相当高的;而CTO所需的头部技能大都为“冰山下”技能:
商业头脑和市场运营。这需要程序员不光有钻研技术的踏实努力,更需要多一份对外界的好奇心,培养广博的视野和格局,去观察和体会市场变化,顺势而行。
管理能力和战略规划。CTO作为企业技术部的一把手,搭班子第一、带队伍第二、定战略第三。刘备找来关、张、赵、诸葛亮,拿捏住这四个人的心理诉求,基本不用操心其他了。这点则需要有良好的沟通能力作为支撑,有效的沟通能让你事半功倍。
当然,除此之外CTO也需要有较强的架构设计能力。这点也一定程度支持了从“系统架构工程师”到“首席技术官”的职业路径的合理性。
个性化职能预测
我们的模型数据主要基于简历中的个人基本信息与工作经历,基本信息为学历、专业等静态属性信息,工作经历则包括过往职能、技能、行业等序列信息。为此,我们选择LSTM作为整个模型的主体部分,完整的模型结构见下图。
如上图所示,对于每一个工作经历的序列节点,我们用Global Average将节点特征压缩为单个向量,在此也可以使用Attention或者全连接等方式来处理,因为节点信息诸如职业/技能等,并没有前后序列相关的信息,所以使用Attention这种无序的信息抽取方式会比全连接更具鲁棒性。院长的实验结果显示,Attention结构并没有比Global Average取得更佳的结果,因此最终还是选择了更为简单的Global Average结构。
工作经历抽象为向量序列后,我们将数据喂给了双层LSTM。一般情形下,循环神经网络都能较好的处理序列数据,但对于RNN结构来说,在序列过长之后很容易出现前期数据遗忘的问题,且易发生梯度爆炸或者梯度消失,所以通常会选择带门控的循环神经网络,如LSTM、GRU等等,这里我们选择了LSTM结构。序列建模经常会用到双向结构,但我们的序列信息属于一种时间序列,如果选择双向结构,则会发生信息泄露的问题,所以最终选择了单向的LSTM模型。
最后在将整个序列信息转为向量t之后,直接拼接基本信息,经过两层全连接输出预测的职能,此为主任务。为了提高模型鲁棒性,我们将前面每个节点的输出(如上图t1)同样的跟基本信息拼接,并预测下一份职能,此为副任务。只预测最后一个职能,会失去一些职能转换的多样性,而副任务可以很好地解决这个问题,并且能让模型更好地学习到职能等特征之间的关系,也变相地增加了数据量。
如上表所示,在得到模型之后,我们对模型效果进行了验证,结果表明:61.5%左右的预测职能与真实职能一致或者高度相似;13.5%左右的预测职能与真实职能相对低阶,容易相互转换;17%左右的预测职能比真实职能看起来更合理;仅8%左右的预测职能与真实职能偏差较大。
这么看来,在大部分情况下,模型预测的结果都符合预期或者相对合理,换句话来说,如果当你对下一份工作不是特别清晰的时候,也许我们能帮你指出一个不错的方向哦!