AI加持的商用求解器+用于新药研发的盘古药物分子大模型:华为云又整出了AI新活儿。
当我们在讨论 AI 使能千行百业的时候,这意味着什么?在生产线上,我们看到越来越多的工厂已经装上了缺陷检测系统、设备监控系统、智能分拣系统…… 甚至在生产前阶段,我们也看到了智能设计系统、原料配比系统…… 毋庸置疑,AI 已经为这些场景带来了生产效能的提升。与此同时,AI 的落地还面临着多方面考验,比如全局协同和资源利用最大化问题如何解决,碎片化、定制化、作坊式的开发模式如何走向规模化等。在 9 月 23 日召开的华为全联接 2021 上,华为云提出了更加丰富、强大的解决方案,发布了「天筹」AI 求解器、华为云盘古药物分子大模型等 AI 服务。华为高级副总裁、华为云 CEO、消费者云服务总裁张平安表示,「天筹」AI 求解器是一款结合了传统运筹学技术和前沿 AI 技术的商用求解器,突破了业界运筹优化极限,在全球权威的 Hans Mittelmann 线性规划单纯形求解器榜单中斩获第一。而华为云盘古药物分子大模型则实现了全流程的 AI 辅助药物设计,可以将先导药的研发周期从数年缩短到一个月。这些 AI 能力都将通过华为云开放给相关行业的从业者,提高生产效能。那么,华为云为什么要开发 AI 求解器?「天筹」AI 求解器和传统求解器有何不同?华为云盘古药物分子大模型具体用来做什么?华为高级副总裁、华为云 CEO、消费者云服务总裁张平安以及华为云 EI 服务产品部总经理贾永利为我们解答了这些疑问。 「某工厂有数千种零件、上万名工人、数百个厂房,疫情期间订单暴涨,如何安排这些资源才能消化更多的订单?」「某大型机场,每天有上千个航班降落,在廊桥机位与远机位的比例为 1:3 的情况下,如何让更多的航班停靠在廊桥?」对于制造、零售、物流等行业的从业者来说,这种问题想必非常眼熟。他们每天都要做出类似的决策,最终目的都是实现最优的资源配置。如果场景比较简单,变量和约束条件都比较少,企业可以用手工方式解决大部分问题(比如用 Excel 排期)。但随着业务规模的扩大,这类优化问题的复杂度会越来越高,变量和约束条件可能增至百万、千万级。这时候,要想实现资源的最优配置就没那么容易了,即使采用简单的启发式或机器学习方法可能找到的也只是次优解。对此,张平安表示:「数字化给企业带来的好处之一,就是让企业可以把大部分复杂的商业、运营的问题抽象成数学问题,通过全域的数字化感知、多域系统数据连通,获得影响复杂商业问题的各种变量和约束,在企业全局和局部求方程的最优解。比如通常熟知的运输、物流行业的装箱问题,城市交通、路径规划和生产排产问题,就可以转换成为对一个万级、百万级、千万级变量的方程组的求解。解决复杂的数学优化问题,就要引入一项根技术:求解器。」华为高级副总裁、华为云 CEO、消费者云服务总裁张平安发布天筹 AI 求解器当然,很多人知道,求解器是用来求解数学规划问题的软件。它就像一个计算器:你把问题以数学形式输入进去,它就可以帮你计算出结果。从理论上来讲,它能处理上千万甚至上亿变量的数学模型,优化产业链和供应链,给复杂场景决策问题一个最优解或近似最优解。但知道是一回事,用不用是另外一回事。为什么不用?因为门槛对很多企业来说太高了。「不要说一般 IT 工程师了,可能连学运筹学的人都要经过培训才能会用。」贾永利谈到。由于求解器的技术壁垒高、研发难度大,长期以来,高性能商用求解器的核心技术始终是由欧美企业主导的。通常来讲,求解器的应用分为两个步骤:一是建模:将问题通过数学形式准确有效地表达,就像给应用题建立方程组;二是求解:把数据和数学模型输入求解器,让求解器自动把最终结果算出来,获得一定范围内的最优解以支撑决策。贾永利举例说,「比如一个供应链的路径规划问题看似就是中心仓和周边仓库的多种组合问题,但如何把这个问题翻译成求解器能理解的数学问题并不简单。」开发和使用门槛高,那多招一些研究运筹学或求解器的专业人才不就好了吗?但现实情况是:没有那么好招。贾永利说,「求解器对数学基础和工程能力的要求都比较高,且其核心技术都把持在各商用求解器厂商手中,研究者很难给出在通用问题上超越商用求解器的算法或策略,所以做这方面研究的人很少。」也就是说,对于大部分企业来说,求解器就像那个伫立在东海的「定海神针」:东西是公认的好东西,但没有几个企业有孙悟空这种专业人才来驾驭。在发现并深入研究了这一困境之后,华为云发现,AI 可以帮忙解决这个问题,于是便有了「天筹」AI 求解器。前面说到,「天筹」AI 求解器是将运筹学和 AI 相结合的商用求解器,那么 AI 的作用体现在哪里呢?首先是上层套件的智能化。求解器只能理解特定的输入,但如何把具体问题转换成这种输入难住了一大批从业者。因此,「天筹」AI 求解器首先要做的就是充当一个「翻译官」的角色,通过上层套件、工具的智能化来帮助用户简化求解器的使用过程,使得具体生产问题到求解器的映射变得更加简单,降低求解器的使用门槛。其次是求解过程的智能化。经典的求解器大多是基于数学经典算法的,但华为云发现,求解的过程其实也可以加入人工智能,从而提高求解速度,这也是所谓的「AI」求解器的另一层含义。华为云主要从更好用和更智能角度来将 AI 和求解器结合:更好用是解决求解器在适应不同场景问题下的最佳参数和策略的配置问题,使得客户不需要反复试验不同的配置参数和策略;更智能是解决固定场景下结合历史数据来优化求解器性能的问题,使得求解器不断适应客户场景和问题,求解效果越来越好。在 AI 和运筹学发生碰撞之后,华为云的「天筹」AI 求解器实现了多项突破:突破了求解规模极限,支持亿级规模问题的求解;
突破了求解速度的极限,利用分布式并行加速技术,速度最高可以提升 100 倍;
突破了建模效率极限,从人工建模到 AI 智能建模,建模效率最大可以提升 30 倍;
突破了求解效率极限,从人工调参到 AI 的自适应调优,效率最高可以提升 30%。
在全球权威的 Hans Mittelmann 线性规划单纯形求解器最新榜单中,华为云天筹 AI 求解器斩获第一,刷新世界纪录。华为云天筹 AI 求解器斩获第一(http://plato.asu.edu/ftp/lpsimp.html 更新于 9 月 18 日)目前,华为云「天筹」AI 求解器已经在天津港等多个大型企业中得到应用,与金融、制造、供应链、交通物流等行业场景深度融合,并带来巨大的经济效益,例如供应链生产排产和供需模拟、生产配料、港口、交通管理、供暖等。作为世界前十的港口,天津港的年集装箱吞吐量接近两千万箱。为了实现更高的吞吐效率,天津港与华为云合作开发了基于「天筹」AI 求解器的新一代港口智能计划平台。该平台可以帮助天津港通盘考虑港口规划中千万级的约束条件和变量,完成整个港口计划仅仅需要 10 分钟,计划速度最高提升 144 倍。如果说全局协同和资源利用率最大化问题离不开 AI 求解器,那么变革碎片化、定制化、作坊式的开发模式则离不开预训练大模型。这些大模型具有极高的通用性,就像一个内功深厚的武林高手,只需少量学习便能掌握新的技能。也就是说,在面对不同场景时,这些模型只需要相对较少的新数据和调参便能实现复用,避免重复造轮子,进而加速 AI 在各个行业的大规模落地。在新药研发领域,动辄十几年的研发周期、十几亿美元的研发成本一直困扰着研究者。其实,大部分的时间和金钱都花在了试错上:为了找到一种有效的药物分子,研究者需要对各种不同的化合物以及化学物质进行测试。AI 模型的出现大大缩短了这一试错过程,它可以在数字世界里完成海量预测,筛选出一部分极具潜力的分子供研究者在物理世界进行实验。华为高级副总裁、华为云 CEO、消费者云服务总裁张平安发布盘古药物分子大模型但是,这种 AI 模型的构建是非常有难度的。首先,AI 模型的训练往往需要大量的数据,而数据往往又是制药公司的核心资产,被视为商业机密,在不同机构之间基本不会共享;其次,药物数据不同于图片和文本数据,如何用深度学习的方法对药物数据进行建模是当前学术界的热点难题;这些门槛将有志于新药研发的普通医药研究者拒之门外。针对这一困境,华为云和上海药物所合作,研发了华为云盘古药物分子大模型,希望能革命性地提升新药的研发效率。张平安表示,该大模型学习了 17 亿个小分子的化学结构,对小分子化合物深度表征,可以高效生成药物新分子,计算蛋白质靶点匹配、预测新分子生物化学属性,并对筛选后的先导药进行定量优化,实现了全流程的 AI 辅助药物设计,在 20 多项药物研发任务(包括新分子生成、属性预测、结构优化等)中达到业界顶级水平。今年 4 月,华为云发布了盘古系列预训练大模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型和科学计算大模型。而华为云盘古药物分子大模型则是「盘古家族」的新成员。这一大模型依托于华为云医疗智能体 EIHealth 平台,目前已经在西安交通大学第一附属医院等机构得到应用。借助这一模型,该院设计出了全新的广谱抗菌药物,将先导药研发周期从数年缩短到一个月。当然,除了新药研发之外,盘古大模型在物流、金融等领域也已经取得了一些成果。贾永利表示:「AI 发展到今天,部分行业、领域已经开始了从『可用』到『好用』的过渡。希望我们的求解器对使用者来说不只是快,更重要的是要简单,要易用,能真正让行业把它用起来。华为云将在 AI 技术上持续创新,结合众多 AI 成功落地的经验,推动行业知识与 AI 进行深度融合。」