Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

周素云编译

除Kaggle外,还有哪些顶级数据科学竞赛平台

数据科学圈晃荡的小伙伴,很少有不知道Kaggle的。Kaggle不仅是一个竞赛平台,也提供了非常好学习机会。通过比赛,你可以接触最先进的方法和数据集、可以与志同道合的人一起参赛,最重要的是能够向全世界展示你的才华。

除了Kaggle,其实还有不少类似的平台,下面文摘菌就给大家盘点一下这些顶级竞争数据科学平台。

DrivenData

DrivenData主要举办的是数据科学类竞赛,通过前沿的预测模型,解决世界上最棘手问题,建立一个更美好的世界。通过举办数据科学竞赛来发挥数据在国际发展,健康,教育,医疗等社会问题中的作用。参赛者可以自己参加比赛或者发布比赛项目。

平台地址:https://www.drivendata.org/

该平台有一个专门的案例分析部分,以案例研究的形式提供一些成功项目的信息。DrivenData中列出的数据集与非营利组织相关,范围从野生动物保护到公共健康。因此,如果你想将数据技能应用于实际问题,DrivenData是一个很好的选择。

CrowdANALYTIX

CrowdANALYTIX是一个众包分析平台,他们将商业挑战和业务问题转化为竞赛。参赛者可以在CrowdANALYTIX社区内通过合作或竞争来构建和优化AI,ML,NLP和深度学习算法的项目。该平台还拥有一个社区博客,其中包含大量资源,包括访谈和参考资料。

平台地址:https://www.crowdanalytix.com/community

社区博客:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html

InnoCentive

InnoCentive 是一家开放式创新型的研究公司。最早是由医药制造商礼来公司资助,创立于2001年,最初的职能是化学和生物领域的研发供求网络平台。服务于190多个国家,为390000人提供相关服务。

该平台主要专注于处理生命科学的问题,但研究领域也包括数学、物理、化学、工程、计算机科学等。参与者需要具有批判性的思维、研究力、创造力、和多学科知识的交叉来解决平台上的实际问题。提出解决方案不仅是一次非常好的能力锻炼,同时也可以获得相应的报酬。

平台链接:https://www.innocentive.com/our-solvers/

TundIT

TunedIT最初是华沙大学的一个科学博士项目。目标是帮助数据科学家进行可重复的实验的,并轻松评估数据驱动的算法。随后,创始团队为了教育研究、科学实验和一些商业目的开发了TunedIT Challenges平台,用于举办此类的数据竞赛。

平台链接:https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c

Codalab

Codalab是一个开源的基于Web的平台,它使研究人员,开发人员和数据科学家能够在同一平台上进行协作,目标是推进使用机器学习和高级计算领域的研究。CodaLab通过其在线社区帮助解决了许多数据导向研究领域的常见问题。平台既支持参加现有的比赛,也支持举办新的比赛。

平台链接:https://competitions.codalab.org/

Analytics Vidhya 

Analytics Vidhya 是一个为分析师和数据科学专家区提供的知识社区。除了为数据科学分析提供大量资源外,平台的Hackathons旨在解决一些工商业界存在的实际问题,并通过竞赛的形式发布。在这个平台上,你既可以参与挑战,也可以赞助比赛。很多在Analytics Vidhya组织Hackathons挑战的大公司也会为优秀的参赛者提供工作机会。

平台链接:https://datahack.analyticsvidhya.com/?utm_source=main-logo

CrowdAI

数据科学挑战平台crowdAI每年都会面临多项开放数据科学挑战。挑战包括图像分类,文本识别,强化学习,对抗性攻击,图像分割,资源分配优化以及跨领域问题。这个平台曾在亚马逊和Nvidia获得了超过10万美元,然后发布称为“Learning to Run”的竞赛。

crowdAI:https://www.crowdai.org/challenges

Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run

Numerai

Numerai是由AI运行,是一群对冲基金圈的数据科学家建设。每周举办一次数据科学竞赛,为真正的对冲基金提供支持。Numerai每周向其参与者提供加密数据,然后参与者提交预测模型。然后,Numerai从其所有提交中创建一个元模型并进行投资。如果投资有收益,数据科学家提交的预测可以换取加密Blockchain令牌。

平台链接:https://numer.ai/rounds

天池

天池是阿里云的数据竞争平台,在很多方面类似于Kaggle。这是一个由数十万数据科学家相互合作并与全球企业和政府联系以解决各行业最棘手的业务问题的社区。

平台链接:https://tianchi.aliyun.com/competition/gameList/activeList

大数据专家、阿里巴巴集团副总裁涂子沛介绍,比赛中胜出的优秀数据模型,不仅可用于参赛者的学术研究成果,还有机会走出实验室,直接应用于淘宝、    支付宝等真实的商业场景,影响中国乃至世界数以亿计的用户。

Data Science Challenge

平台上的数据科学挑战是由英国政府部门赞助,包括国防科学技术实验室(Dstl)、政府科学办公室,SIS和MI5在内多个政府部门。这些挑战旨在鼓励数据科学领域最聪明的人才帮助解决现实问题。目前,该平台提供的两个挑战已经结束,但仍会有源源不断的问题等待者挑战者去解决。

平台链接:https://www.datasciencechallenge.org/

KDD Cup

KDD Cup是由ACM特别兴趣小组组织的年度Data Mining 和Knowledge Discovery竞赛。2019界SIGKDD将于2019年8月4日至8日在美国阿拉斯加州安克雷奇举行。 KDD杯比赛预计将持续2-4个月,获胜者将在2019年7月中旬通知。

今年的三个竞赛课题为:

  • 常规机器学习竞赛轨道(常规ML轨道)

  • 自动机器学习竞赛轨道(Auto-ML Track)

  • “人文研究”强化学习竞赛轨道(Humanity RL Track)

平台链接:https://www.kdd.org/kdd2019/kdd-cup

相关报道:https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

入门数据科学Kaggle
21
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

图像分割技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
推荐文章
TundIT的地址是不是写错了,进去是一个本文的英文版?233