近日,由中国人工智能产业发展联盟和中国信息通信研究院联合举办的第二次“人工智能研发运营一体化(MLOps)技术沙龙”以线上会议的形式召开,来自中国移动、腾讯云、百度等多个企业的产业专家相聚一堂,共话MLOps产业化进程。作为人工智能领域前沿技术的深度参与者,渊亭科技也受邀出席,我司解决方案专家黄勇以《MLOps实践DataExa-Insight中台及应用》为主题发表演讲,介绍了渊亭科技在MLOps方向的实践经验与思考,以及在MLOps方面的实践与效果。
演讲摘要:
以下为演讲实录:
DevOps通过抽象、规范和连接应用程序生命周期的各项操作,体系化的提升开发、集成和交付效率。沿用DevOps的理念,结合机器学习的特点,行业正在探索适用于机器学习领域的最佳实践——MLOps:根据业务理解制定需求方案-准备数据产生相应数据特征-利用数据特征开发模型得到模型文件-持续优化训练直至发布服务-编排模型服务生成服务目录-形成能力工厂。
考虑机器学习生命周期的参与方,可以归纳一些典型的业务角色,MLOps实际是围绕这些角色的协同进行展开:负责标注数据的标注工程师、分析数据特征的数据分析师、基于脚本等进行研究的AI科学家、负责建模的算法工程师、参与资源调度和运维的AI工程师以及关注模型落地的业务分析师。
目前,机器学习的一些难点主要表现为以下几点:第一,数据处理量级越来越大;第二,多场景应用的可复用性;第三,大范围资源优化和效率提升;第四,AI人才短缺。而MLOps作为一套完整的AI技术实践方法论,助力高效全场景支撑,可以有效的解决以上痛点。和常规的机器学习开发不同,MLOps形成的需求-开发-部署-反馈闭环可以持续迭代,帮助模型持续优化。
结合以上思考,渊亭科技梳理了MLOps的落地要点:构建帮助沉淀现有模型的模型仓库-模型开发过程中的资源管理和建模管理-数据挖掘过程中的可视化建模和数据探索-模型服务发布后的发布管理和建模工厂-负责多角色协作的运营中心和资源隔离-智慧中台建设所需的业务中心和知识中心。
基于这些思考,渊亭科技设计了DataExa-Insight中台产品。DataExa-Insight中台以管理中心、资源中心、运营中心为底层支撑,支撑数据中心、服务中心和模型中心这些关键能力。数据中心负责数据从标注到使用的全过程;服务中心承载AI核心能力,包含了AutoML、应用市场、模型发布等内容;模型中心处理模型生命周期的管理工作。
在这些服务的支持下,DataExa-Insight中台在数据准备、模型开发、模型训练、模型服务、服务目录等多个环节中,发挥其重要价值。
MLOps实践过程中,渊亭在如下几个方向上进行了关键设计:
一、数据治理能力集成
数据的数量和质量决定了模型的质量,海量异构数据需要数据中台的能力支撑。在解决和自有/第三方数据中台快速集成上,DataExa-Insight做了一些重要的能力建设,例如:
1、支持20+种异构数据源之间的相互数据同步,无需用户实现复杂的编程,可按需加载插件;
2、支持数据的批量(离线)同步和增量同步等多种同步方式;
3、将数据集成与大数据开发能力有机结合,支持调度&监控告警;
4、提供可视化、统一化的数据配置;
5、基于数据质量追踪和血缘分析能力,能够有效评估数据质量。
DataExa-Insight中台-标注平台
二、流程自动化
流程自动化是MLOps的核心之一。DataExa-Insight中台采用合理的自动化流程设定,有效降低人工智能的应用门槛,提升应用和模型迭代效率。
三、模型完善和应用机制
模型的可复用、可迭代,是MLOps的另一个关键。DataExa-Insight中台从多个层面入手,致力于建成一个具有滚动的、增长的、变化的自学习能力AI中台。
DataExa-Insight中台的领域通用模型由模型代码、通用模型、学习模版三部分来组成,基于领域进行合理的分拆;基于应用市场让模型更容易变现,通过向导式的领域应用,有机结合既有的组成部分(数据、模型、模板等),快速输出模型能力,可供业务自行使用。
DataExa-Insight中台-领域应用模型
四、应用构建傻瓜化
DataExa-Insight中台采用以下举措,构建完备的应用构建和使用机制,更有益于MLOps平台发挥价值:
1、应用支撑工具集成:将分析工具、挖掘工具、清洗工具等集成到应用开发工作台,提高使用效率;
2、应用生命周期管理:将应用开发、应用复制、应用使用、应用评价、应用分享等能力,集中管理和使用;
3、应用开发:DataExa-Insight中台提供多样化的应用开发能力支持,可以使用系统提供的内嵌开发工具进行可视化/脚本化开发,也可以引入独立开发的插件包。
DataExa-Insight中台-范例一览
五、云化理念的MLOps
如何广泛使用云化技术,构建MLOps能力的弹性,向云原生演进?渊亭科技DataExa-Insight中台给出的答案是:
1、云基础设施标准化:基于容器技术的Runtime,标准化地使用IaaS层能力;
2、微服务化:提升业务组件的可扩展性,约束单服务的复杂性,并在微服务划分考虑数据和计算的使用特点,减少数据的搬运;
3、业务能力服务化:基于API-Gateway的服务提供能力,规约化、版本化、可控的提供MLOps特性。
技术栈
最后,黄勇还分享了一个实际的落地案例。该案例基于DataExa-Insight产品能力,集中解决了大型国有企业——中国铁塔内部各个项目的AI应用需求,帮助解决了研发环节复杂、数据访问渠道不一、数据驱动力不足、管理分散、缺少资源沉淀、缺乏反馈与更新机制等问题。
为实现AI服务能力对内、对外的标准化,为各业务场景提供端到端AI能力生产流程,实现AI能力持续孵化演进和快速业务应用,渊亭科技汇聚多来源AI能力和资源,构建了统一的资源池,实现资源共享、提供一站式管理能力,助力AI能力开发和应用,为企业降本增效提供支持。
案例概述
延伸阅读:
DataExa-Insight中台产品介绍:
DataExa-Insight是一个面向企业级赋能的人工智能中台产品,以AutoML、跨AI平台协议等技术为基础,提供人工智能应用构建全生命周期支持,支持科学家、工程师、算法研究员、分析师等全角色协同工作,输出包含机器学习和深度学习的算法级、组件级、引擎级、应用级全栈能力,涵盖了图像识别、自然语言处理、预测分析等数百种AI应用算子,并对计算资源(大数据集群、GPU集群等)进行统筹优化调度。实现人工智能应用构建的平民化、自动化、标准化、安全化,帮助客户快速实现人工智能应用落地,达到可持续性“业务智能化、智能业务化”的目标。