我的公司是否需要独立的数据团队? 我该何时、怎么样建设自己的数据团队?
2017 年 7 月,清华大学数据科学研究院联合《大数据文摘》发布了首份《顶级数据团队建设全景报告》。致力于盘点数据团队建设现状,回答数据团队发展中面临的问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。
在之前的课题基础上,9 月 26 日,今年的《2018 顶级数据团队建设全景报告》(下称报告)在清华大学重磅发布。
本次《报告》将镜头拉近,对准 AI 转型浪潮中,数据团队的变革情况,以及数据从业者的自我建设:
在 AI 革命大潮下,数据团队需要做哪些准备?多数数据从业者的对自己的认知更偏向 AI 还是数据?AI 转型中他们如何发展自己,如何看待自己的技术责任?
调研囊括 110,000+条海内外网络数据分析、1,000+份调查问卷内容,和 8 位海内外业界大咖深度访谈内容,从数据团队本身、技术从业者和高校三个方向,给出了一幅顶级数据团队建设图景。
以下为《报告》部分要点。
人工智能大背景下的数据团队建设
人工智能正在成为时代重要议题,也对数据团队建设产生了重要影响。部分数据团队也已经承担或者计划开展人工智能相关工作。
据调研问卷结果显示,人工智能技术已经成为一半以上数据从业者所在机构的战略性议题。八成以上从业者考虑在未来工作中更频繁使用人工智能相关技术。
在人工智能项目实施上,18% 的机构直接由原有数据团队实施,14% 的机构为数据团队转型的 AI 团队实施,22% 的机构新建 AI 团队实施项目,10% 的机构将这一工作外包出去。
Python 为数据从业者使用最多的数据分析工具,但 C、C++、JS 含金量最高
根据数据相关职位描述中要求的编程语言信息以及相对应的薪资水平,我们计算出了每种编程语言的「技能含金量指数」。
从数据分析结果来看,Python 可以说是数据从业者中最受欢迎的编程语言,问卷调研的受访者中,超过 7 成在工作中需要使用 Python。
但大量的使用者也拉低了该语言的含金量。相反,使用人数占比相对较少的 C、C++ 和 JavaScript 在市场上更具薪资竞争力。
多数数据从业者愿意承担相关技术责任,监管机构和团队管理者更应该对技术后果负责
数据从业者是否应该在技术之外分出心力,了解技术背后更深的影响呢?这一在战争年代常引发巨大争议的话题,在数据安全和人工智能威胁日渐严重的今天,又被重新提上辩论场。
针对「开发者是否应该考虑代码的道德性?」,「如果需要为不正当的用途写代码,你会写吗?」两个问题,多数从业者选择为自己的技术/代码结果负责。
开发人员或可以成为抵御不道德代码和数据安全的最后一道防线。
在我们的问卷反馈中,针对「你认为谁应该为使用大数据与人工智能技术带来的道德问题承担主要责任」这一问题,36% 的受访者选择了政府/监管机构,30% 选择了管理者、19% 选择了技术人员。
在 2018 年 Stack Overflow 针对同一问题的全球调研中,近半数开发人员认为,机器学习和人工智能算法背后的创造者和技术人员最应该对人工智能所带来的社会问题负责。
Stack Overflow 相关调研 :https://insights.stackoverflow.com/survey/2018/#overview
相比国际从业者普遍观点,中国数据团队从业者在「技术责任」这一问题上更强调监管机构和团队管理者的责任。
高校传授技能与市场需求匹配存在偏差:高校注重基础学科,市场更看重实操技能
通过对比国内高校传授技能和公司技能需求,我们发现高校课程设计十分重视包括计算机系统、数据结构、高等数学等基础课程,而这些基础学科能力并不常出现在市场招聘需求中。
而,市场招聘需求中更多地提到了项目管理、产品设计与管理在内的实操技能,这些技能在高校课程中并不常见。
点击阅读原文,下载报告精华版(22页)。