4 月 21 日,阿里巴巴宣布联合清华大学、浙江大学、中国科学院自动化所、中科院软件所、苏州大学 5 所高校发布藏经阁(知识引擎)研究计划。该计划以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网信息内容表达成更接近人类认知世界的形式,从而使计算机具备类脑推理能力。
同时,阿里还宣布打算用一年时间初步建成首个开放的知识引擎服务平台,服务中小企业。
联合 5 大高校 发布 10 大合作项目
和以往单个产学合作模式相比,藏经阁计划采用了新模式,联手清华大学、浙江大学、中国科学院自动化所、中科院软件所、苏州大学 5 所高校参与完成知识引擎的顶层设计,首期将合作 10 大项目,涵盖知识表示与推理、大规模文本挖掘与信息抽取、基于知识库的语言理解与问答、多语言数据融合等多个技术领域。
该计划将重点打造知识构建、知识推理两个层次的技术,以多源大规模数据为对象,研究从大数据向通用和领域知识转化的共性关键技术。
「我们将围绕知识工程生命周期的知识建模、知识获取、知识管理和知识重用 4 个阶段,研发 5 大通用技术模块,包括大数据知识建模、知识获取、知识融合、知识推理计算、知识赋能,建立多领域知识图谱,并提供基于知识的平台化服务。」清华大学教授、藏经阁计划学术负责人李涓子说。
阿里巴巴集团副总裁、藏经阁计划阿里负责人墙辉 (玄难) 在谈到此次合作时介绍,启动藏经阁计划是为了为应对机器智能对大规模知识的迫切需求,知识引擎在阿里巴巴业务场景中有广泛的应用,研究计划也会首先在天猫精灵、搜索、国际化业务中应用。
攻坚 AI 推理技术 阿里将开放知识引擎服务平台
知识引擎是人工智能的基石,也是推动人工智能发展的核心驱动力之一。它可以学习和记忆知识,使得机器具备人脑一样的推理能力,这也成为各大巨头争抢进入的一个热门技术领域。
阿里巴巴的最大特色在于以知识引擎的理念重构电商核心数据。通过知识表示技术,以商品、标准产品、 标准品牌、 标准条码、标准分类为核心,实现商品数据的标准化和知识化。
很显然,让电商大数据更好地服务消费者是阿里巴巴首先要解决的问题,而在淘宝、天猫、1688、AliExpress 等多个市场沉淀的数据,也成为知识引擎的数据来源。
据玄难介绍,目前阿里利用实体识别、实体链指和语义分析技术,整合关联了例如舆情、百科、国家行业标准等 9 大类一级本体,包含了百亿级别的三元组,形成一个巨大的知识网络和海量的标准数据。品牌商、行业运营、治理运营、消费者、物流商等多种角色参与。
现在,阿里巴巴希望通过与高校的联合研发,引入前沿的自然语言处理、知识表示和推理等技术,形成完整的知识引擎服务平台,并且对外开放,服务所有的中小企业。