Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
放眼15年、聚焦三大方向,AI大牛陶大程带领京东探索科技前沿的征途开始了
求其近者必追其远。
今年 6 月,伴随着一场如盛夏般火热的年中大促,「快递火速送达」也成为人们讨论的焦点。京东第一单快递送达消费者从支付尾款到收货仅用了 4 分钟。走过十年,京东 618 在不断刷新销售数据的同时,也创造了「4 分钟送达」、「自营商品超数百万 SKU」、「31.2 天库存周转」等世界级纪录。而这些看似单点的突破实则需要在供应链的生产、流通、服务的全链条中配合实现。京东 618 已成为国内人工智能技术大规模应用、覆盖全链条的超大规模实践场景。京东在各环节极致效率的达成,已经不再是依靠传统的管理效率提升能够做到的,而是必须依托云计算、AI、大数据、物联网、区块链等新技术作为「底座」来实现。在人工智能加速新一轮产业变革的新时期,具备丰富业务场景和海量数据的京东身处此轮变革的最前沿,正着力于全面布局人工智能等数字技术领域。求其近者必追其远,在人工智能、云计算、大数据、物联网等新兴技术蓬勃发展的当下,京东立足技术之根本,加大了新基础设施建设以及人才培养的投入,为未来 10 年、乃至更远的科技、产业发展备足能源,为技术成果在实际场景中的应用落地注入不竭动力。2020 年 10 月,京东首次系统阐释了面向未来十年的新一代基础设施——京东数智化社会供应链,即用数智化技术连接和优化社会生产、流通、服务的各个环节,降低社会成本、提高社会效率。2020 年 11 月底,在 JDD 京东全球科技探索者大会上,京东探索研究院正式成立,今年人工智能和信息科学领域国际顶尖学者陶大程教授出任京东探索研究院院长。近日,陶教授出席 2021 世界人工智能大会(WAIC),这是陶教授任京东探索研究院院长以来,首次亮相国际级技术大会,揭晓了他将带领京东探索研究院探索科技前沿的方向和步伐。「AI For Social Good——坚持技术的伦理,做有温度的科技」,这是京东探索研究院的发展愿景。在这一愿景下,京东探索研究院将持续研究 AI 在国家双循环政策、碳中和、智能供应链、知识积累与人文发展等方向的结合与联接,实现科技创新、产研协同、人才培养、科研助力、跨界融合与科技公平诸多目标的平衡、和谐发展。京东探索研究院致力于打造以理论科研为基础的技术生态,创造科技创新的新循环。具体来说,就是通过基础理论研究推动技术的突破,构建人工智能系统平台,通过这个平台实现相关产品的联接以及生态的构建,再通过生态构建达到泛人工智能领域人才培养的目的,最终通过人才反哺基础理论研究、平台建设、产品以及生态。自成立至现在,京东探索研究院仅用半年的时间就汇聚了两百多名研究员,均是人工智能等领域理论研究的尖端人才。他们来自于北京大学、清华大学、中国科学院大学、浙江大学、上海交通大学、悉尼大学、新加坡国立大学等 30 个国内外知名高校,已组建起强大的研究团队。同时,经过半年多缜密的论证,京东探索研究院明确将研究方向锁定为「可信人工智能」、「超级深度学习」、「量子机器学习」这三大人工智能领域。致力于从基础理论层面实现颠覆式创新,助力数智化产业发展及变革。为什么是这三个方向?我们从陶院长的演讲和京东探索研究院的成立初心中找到了答案。AI 给众多传统行业带来了新机遇,但也因其「黑箱子」式的模式带来了隐私泄露,算法偏见,技术不可控等问题。例如在使用「拍照购」时,如果照片中的物品被遮挡了一部分,那么 AI 系统可能就难以分辨出这个商品。再比如道路交通牌如果被贴上小广告,无人驾驶系统就可能对道路交通牌产生误判,这对于无人驾驶系统来说是非常危险的。随着 AI 在商业场景中愈发广泛和深入的应用,AI 产品引发的事故和纠纷时有发生,在这些场景下如何区分各个主体的责任和权利,是产业界和监管机构面对的新问题。如何让 AI 变得更加可信,是学术界、产业界以及相关管理部门近年来非常关心的问题。可信人工智能聚焦于人工智能技术的稳定性、可解释性、隐私保护能力、公平性,致力于更好地保护用户与推动商业有效合作。京东探索研究院将从理论出发,探求深度学习的工作机制、研究深度学习的快速优化算法、分析神经网络的隐私保护能力与公平性,保障人工智能落地应用的可解释性。京东探索研究院的这一目标与 2021 WAIC 可信人工智能论坛的主题「AI 向善,全球共治」不谋而合。可信 AI 论坛从理论研究的角度溯源人工智能本身的技术问题、与行业应用结合后的社会问题,以及人工智能治理问题,从哲学、伦理、技术的多层角度界讲解了可信 AI,洞见了领域趋势。在论坛上,陶院长讲述了可信人工智能的前世今生,他表示人工智能正进入广泛的落地阶段,面临的问题也在逐步增多。2016 年 4 月,欧洲提出了《通用数据保护条例(GDPR)》;2017 年 12 月,IEEE 提出了人工智能设计的伦理准则,之后欧盟、澳洲、美国、新加坡等都提出了相关的政策、指南或白皮书。中国的发展是什么样的?2017 年 11 月,何积丰院士于香山科学会议上首次提出了「可信人工智能」的概念。2017 年 12 月,工信部发布了《促进新一代人工智能产业发展三年行动计划》。在此之后,中国的科技公司纷纷提出了可信方面的规划和进展。2019 年 10 月,京东在乌镇世界互联网大会上提出了京东践行可信赖 AI 的六大维度。今年 4 月,京东探索研究院确立可信人工智能作为主要战略研究方向之一。无论是欧盟的《通用数据保护条例(GDPR)》还是中国的《个人数据隐私保护条例》,都表明人们要更加谨慎地使用个人数据,也说明用户对个人信息的保护具有相当的权利。例如 GDPR 中谈到了用户遗忘权,我们如何实现用户遗忘权?当用户从某个人工智能系统的平台上离开之后,如何把清理用户信息?这不仅要对数据库进行处理,也对人工智能系统的模型提出了很多要求。此外,人工智能的使用者是非常广泛的群体,年龄跨度广,可信 AI 致力于保障人工智能的公平性。人工智能系统不仅要服务于大众用户,也要对小众用户有对应的支撑,保证所有人都能够公平地享受到技术带来的价值。陶院长提到:「可信并不是一个很新的概念,实际上在触及技术本身的时候,很多人都在谈技术的可信,人工智能的可信,算法的可信或者是可信计算等,其中包含的点非常多。」自 2017 年至今,不同的白皮书在多个方面提出了可信的相关概念。IEEE 提出了透明性:以正确的方式使用技术,以人为本,明确责任,造福人类;欧盟提出:提升模型的鲁棒性与安全性、人类的监督与干预、明确责任等;澳大利亚也提出:隐私保护,造福社会与环境,明确责任、透明性和可解释性等;美国谈到了可溯源、可解释、以性能为导向等。而中国则谈到了包容共享、和谐友好、公平公正、可控安全等几个方面的可信。陶院长表示,可信涉及的方方面面非常多,经过完备的探讨,最终人工智能的「可信」能够从四个方面来度量:一是稳定性。稳定性是人工智能系统抵抗恶意攻击或者环境噪声并且能够做出正确决策的能力。稳定性的度量有很多种方式,比如对抗攻击,通过对算法攻击的成功率来度量稳定性。那么如何提升系统的稳定性?对抗训练、样本检测等都是目前能够提升稳定性的方法。关于稳定性的度量和技术提升还有待于进一步研究。二是可解释性。就是人工智能系统在做出决策的过程中,需要用人类能够理解的方式来解释人工智能究竟是怎么完成这些事情的。可解释性的度量则涉及到如何去有效地理解人工智能系统,例如我们如何描述模型的泛化能力。理解了神经网络的相关性质,我们可能会更好地理解模型的超参等理论,避免称人工智能为经验驱动、炼丹术。此外,除了模型和算法的可解释性,样本也需要具备可解释性。可解释性的研究内容包括有效性分析、样本检验、显著性分析等。三是隐私保护。良好的人工智能系统不应该把个人的隐私信息或者群体的隐私信息对外泄露。隐私保护是非常重要的一个方面。今天我们越来越注重个人隐私,人工智能系统应该充分保护个人隐私,不受他人的侵犯。衡量隐私保护有多种方法,以差分隐私为例,差分隐私的性能越好,隐私保护的能力就越强,或者攻击的成功率也能够用来表征隐私保护能力,攻击的成功率越高,隐私保护的能力就越差。四是公平性。人工智能系统需要公平公正,正确地对待所有的用户,包括大众用户、小众用户,不同性别等。在人工智能系统被诟病存在偏见的今天,保障系统的公平性,对不同的个体和群体做出不含偏差的决策是急需改善的一个方面。「这四个方面是不是完全独立的?如果不是,它们又是怎样互相影响的?」陶院长表示这将是未来深入研究的问题,具有重要意义。未来人们需要依靠这四个方面来明确责任,人工智能系统一旦出现问题,就需要知道系统出现问题的原因,以及谁来承担责任和承担责任的方式,因此明确的量化评价指标是必不可少的。经过数月的系统梳理和落实,在可信 AI 论坛上中国信通院联合京东探索研究院发布并解读了国内首本《可信人工智能白皮书》,从理论和实践双重视角对可信 AI 进行深入浅出的剖析。白皮书首次系统性地提出可信 AI 全景框架,全面阐述了可信 AI 涉及到的基础支撑技术及应用场景,对于促进产业界落实 AI 伦理规范有重要意义。此外,白皮书基于当下学术界和产业界对可信 AI 的研究和理解水平,提出了有助于完善可信 AI 生态的务实方案和发展建议,有助于促进社会各界以合作共赢的态度推动可信 AI 的发展。《可信人工智能白皮书》首次系统性地提出可信 AI 全景框架,全面阐述了可信 AI 涉及到的基础支撑技术及应用场景,对于促进产业界落实 AI 伦理规范有重要意义。此外,白皮书基于当下学术界和产业界对可信 AI 的研究和理解水平,提出了有助于完善可信 AI 生态的务实方案和发展建议,有助于促进社会各界以合作共赢的态度推动可信 AI 的发展。未来三到五年,京东探索研究院将把可信人工智能作为重点研究方向。着眼于当下人工智能的发展现状,从学术的角度看,人工智能被认为是潜力无限的,甚至是无所不能的。但从打游戏到下围棋,再到水下图像处理和视频理解,学术界的很多设想都远超现在工业落地的情况。今天的人工智能需要大量的人工支持,落地困难是 AI 领域正在面临的巨大难题,也让 AI 技术在推动产业变革的进程中陷入瓶颈。在 2021 WAIC「数字经济 产业升级新动能」论坛上,陶院长剖析了 AI 技术落地困难的根源,主要包含以下四点:应用场景复杂:人工智能在落地阶段需要面向纷繁复杂的现实场景,往往需要依靠多路不同类型的传感器来获取各种信息,这些信息可能包含噪声和信号干扰,并且表达物理空间表征的模式也可能是非常不同的,最终得到的是难以融合的异构数据。
实际任务多样:人类处理多任务问题是非常容易的,以炒菜为例,整个过程包括买菜洗菜切菜炒菜等多个任务步骤。但这样的过程对于机器来说是非常具有挑战性的。此外,相比于机器,人类并行执行多任务的能力也要强大很多,例如我们在听音乐时脑海中能够想象出一些有意思的画面。
算力分布分散:今天的算力是分布式算力,不同的高校、研究机构、科技公司都有自己的算力平台,个人也有个人的移动设备、个人电脑等。但实际上目前没有有效的手段把这些分布式算力整合起来,以高效集中地使用这些算力。
缺乏理论支撑:最重要的一点是现在的人工智能缺乏一些理论依据,例如深度学习效果好的具体原因尚不明确。AI 领域的很多问题需要理论研究去找到答案和更深刻的理解,否则神经网络就会被诟病是一种「炼丹术」。目前领域内已经有研究发现了一些理论基础,但这样的发现对于支撑整个神经网络和实现神经网络对人工智能的价值,以及人工智能掀起产业变革还是远远不够的,这需要大量的时间。
为了打破这种瓶颈,推进 AI 技术落地,实现产业变革,构建超级深度学习模型生态系统成为一条通向未来的道路。谈到为什么要构建超级深度学习模型生态系统,陶院长阐明了超级深度学习模型生态系统生态系统的优势。首先,当前在领域和行业内,「大模型」逐步成为一种趋势;
其次,大模型能够处理多模态的数据,能够有效地融合这些模态,把不同的传感器信息有效地整合到一起;
第三,借助超级深度学习生态系统,相关的分布式算力能够被整合;
第四,超级深度学习模型有可能能够帮助 AI 领域构建相关的理论支撑,来保证深度学习具有良好的落地效果。
最终超级深度学习模型生态系统生态系统将有望帮助人们实现智慧医疗、智慧物流、智能制造的美好愿景。放眼当前的算料、算法和算力,我们可以发现,数据的规模是呈指数增长的,而现在刚好到达一个非常好的时间拐点。参数模型从早期的单层网络演变到多层网络,再到现在的深度网络,规模也是指数级上升的。大量的实验结果表明,越深、越大的网络具有更好的效果。此外,在理论上,研究者们也观测到双下降(Double Descent)、过拟合等情况实际上可能是好事。以前「过学习」是被诟病的,但现在研究者们发现「过学习」有可能会带来一些额外的价值。 另外,从算力的角度,无论是国内的华为,国外的英伟达等各大芯片厂商,行业内算力的进展都是非常迅速的,也是呈现指数级增长的趋势。所以今天正是到了一个非常合适的时间节点来发展超级深度学习,预计在未来 5 到 10 年超级深度学习将会逐步支撑数智化社会供应链体系的实现。从理论上分析,超级深度学习具备两个优势:第一,大的超级深度学习模型的泛化能力是非常好的,而且在一定程度上能够得到非常好的收敛率;第二,训练好超级深度学习模型需要有大规模的训练数据,在具体场景落地的阶段,在特殊的数据下通过提出微调(fine-tune)的模式,模型的泛化能力将能够得到大幅提升。多项研究已经证明多模态模型的优势和多任务模型的价值。多模态数据的融合有利于帮助研究人员分析噪声等对数据带来的影响,相对于单模态模型,多模态模型具有更好的泛化性能。此外,多任务模型可以通过不同任务之间的关系相互正则化,以保证最终训练出来的模型泛化能力越来越好。训练这样的超级模型需要大量的数据,如果依赖传统的标注方式将会非常困难,因为标注大数据的成本非常高。那么是否有一些方法能够帮助我们降低标注成本来进行模型训练?答案是肯定的。例如文本方面,生成式预训练可以把数据中的一部分拿掉,让模型对数据进行重构;图像方面,通过对比学习(contrastive learning)进行的对比式预训练可以减轻训练负担。最近的一些研究发现,这些训练方法能够得到很好的训练效果。京东探索研究院作为超级深度学习阵营的一员,将从理论出发,研究面向海量多种模态数据超级神经网络模型的深度学习新范式。针对多模态数据中的时空耦合、语义关联、信息互补等特点,探索适用于超级模型的自监督学习、弱监督学习、小样本学习、零样本学习等机器学习方法。实际落地阶段,超级模型适应到相关任务上,这里就涉及到如何做好微调,在部署模型时,实际的空间和计算资源都是非常有限的。这个时候就需要对模型进行压缩,例如可以通过知识蒸馏或者迁移学习,针对特定任务把数据应用到场景之中。业内已经出现一些超级深度学习模型简单应用了,例如用最近非常热门的 GPT-3 做自然语言处理,在机器翻译、智能问答等任务上都取得了相对于原来小规模深度学习模型更好的实践效果。虽然还有很多不足的地方,但是超级深度学习模型的未来价值已经有所体现。超级深度学习模型的生态系统未来将会引发新一轮的数字经济变革。这源于超级深度学习模型有能力去整合不同模态、不同源头、不同任务的数据和信息。人们日常生活中的信息数据包含了电子商务、自动驾驶、旅行、物流、医疗等信息。利用超级深度学习模型,不同模态的数据能够被有效整合和低成本对齐。如此,超级深度学习将能够满足经济变革的需要,包括新的生产需求、新的应用场景以及新的商业模式等。在产业层面,超级深度学习将赋能全产业链,包括智能零售、智能物流、智能供应链等多个与人类需求相关的产业。最终京东的超级深度学习将做到理论有支撑,实际有应用,技术有突破。京东作为一家供应链管理公司,供应链效率的提升将会为整个集团带来巨大价值。在智能制造方面,京东探索研究院将通过超级深度学习推进数智化转型和生产方式变革。构建智慧供应链、数字化仿真设计、无人化生产、人机协同管理、大数据智慧运营的全周期智能工业平台。此外,超级深度学习的应用还将跨学科延伸到智慧文旅领域,在数字博物馆、多语言识别翻译、文物虚拟修复、古文字识别等具体应用场景下推进文化沟通交流、文化遗产保护等人文发展方向。从多层感知机到统计学习模型,再到以深度神经网络为核心的现代 AI 技术,人工智能领域已经历数次质变飞跃,如今正迈向超级深度学习的新纪元。超级深度学习带给我们的将是科技变革、经济发展、文化融合的全方位「升维」体验。当前,全球量子计算的竞争日趋激烈,量子计算机已能够实现传统计算机无法实现的任务。相比于传统计算机,量子计算机具有更高的算力和更低的能耗。专家预测,到 2040 年全球电力储备将无法支持传统计算机的运行,低能耗的量子计算机将解决这一困境。5 月,京东探索研究院首次探索了量子自编码器在量子计算、量子机器学习、量子信息处理以及量子传感领域的实际应用,并理论证明了其计算优越性。作为三大研究方向之一,京东探索研究院还首次从理论上探讨了量子计算领域中的核心问题——如何有效度量和控制量子算法的复杂度,从而保证良好的训练能力。具体来说,是将量子神经网络和应用在量子化学领域的量子变分求解器统一在一个数学框架下,从而可以使用统计学习理论中的 covering number 来刻画这些算法的复杂度。在量子机器学习领域,统计学习理论已证明量子神经网络在机器学习、化学分子模拟应用中的表达能力,量子机器学习的加速效果在理论和实践上也都已被初步证实。京东探索研究院将长期致力于设计可在现有量子计算机上运行的具有量子优势的机器学习算法,从深度学习理论、统计学习理论、优化理论等角度研究量子机器学习算法超越经典算法的能力。未来京东探索研究院将通过 NISQ 时代量子机器学习的工作机制展开具备量子优越性的量子机器学习前沿研究。从量子神经网络理论、量子隐私机器学习、量子机器学习 + 传统 AI 等研究方向进行探索,最终推进药物设计、金融分析、分子化学、量子信息、量子传感等领域的发展。面向未来,京东探索研究院将可信人工智能作为三到五年的研究方向,将超级深度学习作为五到十年的研究方向,而将量子机器学习作为十到十五年的研究方向,互为承接、循序渐进。在一个新纪元到来之前,我们或许无法预见它的全部,但秉持「技术为本,致力于更高效和可持续的世界」的京东已然做好准备,迎接新的挑战。