Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Kaggle联合创始人、首席执行官Anthony Goldbloom离职,开启新创业

刚过完 12 岁生日的 Kaggle,迎来了新一任 CEO。

6 月 6 日,Kaggle 官方宣布 D. Sculley 将成为 Kaggle 新领导者,其联合创始人兼首席执行官安东尼 · 高德布卢姆(Anthony Goldbloom)以及联合创始人兼 CTO Ben Hamner 将离开 Kaggle 和谷歌,开始新的创业。

D. Sculley

D. Sculley 于哈佛大学获得学士和硕士学位,于塔夫茨大学获得计算机科学与机器学习博士学位,师从 Carla E. Brodley 教授。

在过去 20 年里,D. Sculley 一直在进行机器学习前沿技术的研究,在谷歌工作期间,他领导了超大规模机器学习系统的研究,还对 MLOps 等方向进行了基础探索。D. Sculley 也与 Kaggle 很早就产生了联系,从他在 2011 年发起半监督机器学习挑战开始,现在,他成为了 Kaggle CEO。

成立 12 年,Kaggle 成就满满

Anthony Goldbloom 于 2010 年在墨尔本创立了 Kaggle,主要为开发者和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。2017 年 3 月谷歌官方博客宣布收购 Kaggle,目前该平台已经吸引了数百万数据科学家的关注,就在最近 Kaggle 刚过完 12 周岁生日。

Anthony Goldbloom

Kaggle 起始于一个轻松的比赛项目,该项目是预测 2010 年欧洲歌唱大赛的投票矩阵。当时,很难想象 Kaggle 会在未来的机器学习人工智能领域发挥重大作用。

成立 12 年,Kaggle 取得的成就可总结为:首先也是最重要的是 Kaggle 对人们生活的影响,许多人通过 Kaggle 开始学习机器学习。在将近 1000 万用户中,有 110 万已经提交了 Titanic 入门比赛的算法 ,大约 100 万用户完成了 Kaggle 课程练习,18700  个大学课程举办了课堂竞赛,有 88 万学生参加了这些竞赛。

不仅新手可以使用 Kaggle 进行学习,高级用户同样也可以,并有机会从成功的解决方案中学习。正如 Kaggle 大师 Vladimir Iglovikov 说的那样:「我认为机器学习竞赛好比健身房,机器学习好比肌肉。」

Kaggle 还为机器学习领域的研究者提供凭证。早在 2012 年,Meta(原 Facebook) 就开始使用 Kaggle 挖掘机器学习人才。到 2017 年,Kaggle 已经成为获得精英 AI 人才的好方法。如今,英伟达和 H20.ai 等知名 AI 公司都聘请了 Kaggle 大师团队。

Kaggle 在实践中也发挥着重要作用。该机构表示,每天 Arxiv 上会发表约 200 篇相关机器学习论文,与此同时,相关研究者已开发了无数机器学习工具。

Kaggle 用户在竞争激烈的环境中探索这些技术,并传播那些行之有效的方法。像 Keras 和 XGBoost 这样的框架在 Kaggle 社区中流行起来,此外还包括预处理和数据增强库。许多技术已经通过 Kaggle 平台传播,包括用于分割的 U-Nets、去噪自动编码器和对抗性验证。Kaggle 帮助研究者证明了机器学习的新应用,包括医学成像和自动论文评分。

最后,值得一提的是,虽然 Kaggle 从机器学习竞赛开始,但其已经推出了其他服务。Notebooks 增加了用户分享学习的方式,推出的课程让 Kaggle 更容易被新用户接受。此外,Kaggle 还收集了超过 15 万个公共数据集,这使得 Kaggle 成为世界上最大的公共数据集存储库之一。

当然,如果没有社区和 Kaggle 团队,上述这一切都不可能实现。期待 D. Sculley 带领 Kaggle 更上一层楼。

参考链接:https://www.kaggle.com/discussions/general/329411

产业Kaggle
相关数据
自动编码器技术

自动编码器是用于无监督学习高效编码的人工神经网络。 自动编码器的目的是学习一组数据的表示(编码),通常用于降维。 最近,自动编码器已经越来越广泛地用于生成模型的训练。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

XGBoost技术

XGBoost是一个开源软件库,为C ++,Java,Python,R,和Julia提供了渐变增强框架。 它适用于Linux,Windows,MacOS。从项目描述来看,它旨在提供一个“可扩展,便携式和分布式的梯度提升(GBM,GBRT,GBDT)库”。 除了在一台机器上运行,它还支持分布式处理框架Apache Hadoop,Apache Spark和Apache Flink。 由于它是许多机器学习大赛中获胜团队的首选算法,因此它已经赢得了很多人的关注。

推荐文章
暂无评论
暂无评论~