在 3 月 8 日刚刚结束的第一天的 Google Cloud Next 17 大会上,谷歌云机器学习与人工智能首席科学家李飞飞在 Keynote 演讲中正式宣布谷歌云收购数据科学社区 Kaggle 这一消息。随后,Kaggle 官方网站和谷歌云平台博客也正式发布了这一收购消息。
Kaggle 由 Goldbloom 和 Ben Hamner 创建于 2010 年。是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。数据科学社区有这样一个难题,即众多策略可以用于解决几乎所有的预测建模问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。Kaggle 的目标则是试图通过众包的形式来解决这一难题,进而使数据科学成为一场运动。
在只面临少数竞争者(如 DrivenData、TopCoder 和 HackerRank)时,Kaggle 就已经开始了这项服务,并通过专注特殊壁垒成功建立了领先优势。Kaggle 官方表示,该社区目前在全世界范围内有超过 85 万的数据科学家用户。
其实,Kaggle 和谷歌合作的历史也不是一天两天了。比如本月初的时候,谷歌和 Kaggle 联合主办了一个 10 万美元的围绕 YouTube 视频分类的机器学习比赛。那场比赛也与 Google Cloud Platform 进行了深度的整合。收购 Kaggle 后,谷歌将获得一个最大最活跃的数据科学家社区,并提升其在社区之中的影响力。
李飞飞在接受媒体采访时表示,「人工智能的发展需要数据民主化以及越来越多的数据和模型,这是我们对 Kaggle 高度重视及收购的原因。」
对于这次收购,Kaggle CEO Anthony Goldbloom 在官方博文中写道:
我很高兴和自豪地宣布 Kaggle 正式加入谷歌云。
七年前,我们发起了第一个预测欧洲歌曲大赛投票模式的竞赛。当时获胜者是 Jure Zbonar,他们击败了 21 支队伍,赢得了 1 千美金的比赛奖金。
从那时起,Kaggle 社区已经使用机器学习为高中作文评级、诊断心力衰竭,并加强对希格斯波色子的发现。在 Merck 比赛中,Geoff Hinton 和 George Dahl 为我们展示了深度神经网络的神奇力量,Tianqi Chen 使用 Kaggle Kernels 为社区引入了 XGBoost。Kaggle 的个人主页已经成为一张可以得到认可的证书,社区成员找到的雇主从 DeepMind 到沃尔玛不等。去年八月,我们发起了一个开源数据平台,社区成员已经在这个平台上共享了数以百计的高质量数据组。我们已经一起取得了很多的胜利。
Kaggle 团队将继续团结在一起,也会成为谷歌云团队中一个独特品牌。我们也会继续增强我们的竞争力以及开源数据平台数量,也会继续将它们面向所有数据科学家、公司以及技术开放。Kaggle Kernels 也会继续支持一个多样的生态系统,包括谷歌支持下的机器学习库和工具包,也包括谷歌工具包之外的。
加入谷歌能让我们取得更多的成绩。这次收购将世界上最大的数据科学社区与世界上最强大的机器学习云联合起来,也是一个将我们的力量与 ImageNet 创造者李飞飞和李佳联合起来的良机,让人振奋。
将谷歌云技术提供给我们的社区,我们就有能经常提供强大的基础架构,可扩展训练以及部署服务,也有能力存储和询问大型数据集。