上个星期,英特尔大数据技术全球 CTO、大数据分析和人工智能创新院院长戴金权为我们分享了英特尔最近的工作。
「英特尔希望提供端到端全栈人工智能产品和软件的技术栈。」戴金权表示。「从硬件角度来说,我们拥有从 CPU、GPU、FPGA 到各种 AI 加速器,从边缘到数据中心的全面布局。从软件层面上,我们也做了非常多的工作。」
从 oneAPI 到 OpenVINO、Analytics Zoo 等等软件工具,英特尔一直以来都希望能够通过软硬协同来推动人工智能和数据分析的创新。在去年 6 月份,这家公司设立了「大数据分析和人工智能创新院」,希望通过统一的数据分析和人工智能工具推动 AI 技术应用落地。
据介绍,大数据分析和人工智能创新院总部设立在中国,现在它在中国和美国硅谷都有研究团队协同工作。
「通常,数据科学家会在自己的笔记本上使用样本数据构建原型,其可能是基于 Python 的文本,如果原型工作得不错。下一步要做的就是利用大量数据进行实验。」戴金权介绍道。而在大数据集群环境中进行实验与部署上线,一直是很多开发者们面临的挑战。
英特尔希望能够让人们能够在笔记本上构建端到端的流水线,工具可以直接访问生产数据,AI、大数据应用从笔记本到生产环境中、分布式环境中不需要做任何修改。
英特尔创新院致力于应用技术的研究,其主要方向由三部分组成:首先是前沿创新研究,近一年来,英特尔和内部、外部的研究机构联合,一些研究成果已在在线学术会议上进行了展示。
第二部分是技术开源,这家公司已把技术研究通过开源软件平台的方式分享出来。在今天的科技领域,大数据分析、人工智能等基础架构基本都是基于开源软件技术的。
此外还有应用落地。「当我们有了这样的开源软件和技术之后,我们会与自己的客户、合作伙伴等等一起合作,将这些技术应用在他们的产品服务或者是应用系统当中,这是我们大数据分析和人工智能创新院所做的三件事情。」戴金权说道。
最近的一年多时间里,英特尔还推动了机器学习工作流的进一步扩展,戴金权还表示英特尔正在研究 AI 自动化构建工具:「我们进行了很多 AutoML 的探索。以及大规模分布式自动推理的服务。在 CVPR2020 上我们会展示如何在大规模分布式环境中进行自动化机器学习工作流程。」
这些前沿研究也会通过开源软件平台进行落地,包括 BigDL、AnalysisZoo 等。英特尔还会在即将进行的 CVPR 2020 大会上开办活动介绍这些最新技术(Automated Machine Learning Workflow for Distributed Big Data)。
2018 年推出的 AnalysisZoo 被英特尔定义为存在于深度学习框架之上的高级平台。「某种程度上来看,用户对于使用哪种框架并不是非常敏感,」戴金权表示。「如何能够使用最优方法实现最优效果才是最重要的。」
Analysis Zoo 构建于英特尔的 One API 之上,在这个基础之上该工具还能通过 AutoML 的方法构建出自动化的流水线。
在活动中,英特尔向我们介绍了一系列合作案例,如阿里云的 E-MapReduce 开源大数据服务上集成的 Analytics Zoo,可在其服务上直接运行深度学习应用。去年,英特尔也与阿里云在 Flink 上进行了合作,在阿里天池大赛上利用 Flink、Analytics Zoo 实现了实时的垃圾分类检测的工作。