8月24日至27日,由中国中文信息学会语言与知识计算专业委员会主办,浙江大学承办的2019年全国知识图谱和语义计算大会(CCKS:China Conference on Knowledge Graph and Semantic Computing)在杭州召开。本届大会以“知识智能”为主题,吸引了近千名国内外高校、研究院以及企业相关领域的学者和研究人员参会,围绕知识图谱、语义计算和语言理解的关键技术和应用等话题展开了深入探讨。
CCKS是由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议。CCKS源于国内两个主要的相关会议:中文知识图谱研讨会The Chinese Knowledge Graph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web and Web Science Conference (CSWS)。
全国知识图谱与语义计算大会致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,聚集了众多知识表示、自然语言理解、智能问答、知识抽取、图数据库等相关技术领域的学者和研究人员,力求为我国语言与知识计算领域的学术研究和产业发展,为从事相关理论和应用研究的学者、机构和企业提供广泛交流的平台。
大咖云集 共论未来发展
CCKS2019分为讲习班和主会两个部分。在8月24-25日举办的《前沿技术讲习班》——知识图谱专题(CIPS ATT16)论坛中,六名中外知名青年学者与企业代表带来了精彩的学术前沿和应用技术报告。加州大学圣巴巴拉分校教授严锡峰,南加州大学助理教授任翔,密歇根州立大学助理教授Jiliang Tang ,新泽西州立大学助理教授张永峰,以及腾讯微信模式识别中心高级研究员林衍凯,深度好奇创始人吕正东,分别以“自然语言界面、知识图谱构建和推理、图深度学习、知识指导的自然语言理解、可解释推荐和阅读理解”等为主题作了分享。
在8月26日召开的CCKS2019开幕式上,中文信息学会理事长方滨兴院士为大会开幕式致辞,清华大学李涓子教授代表语言与知识计算专委会致辞,CCKS2019大会主席清华大学朱小燕教授、程序委员会主席哈尔滨工业大学秦兵教授分别为大会致辞并介绍大会情况,本次大会承办方主席、浙江大学陈华钧教授主持了开幕式。
在特邀报告环节,英国南安普顿大学计算机科学教授Wendy Hall作了题为《Web Science, AI and Future of the Internet》的报告,她从人工智能发展带来的潜在威胁入手,指出必须采用社会技术方法分析互联网的发展,以确保未来的互联网能够帮助人们创造一个理想生活的世界。伊利诺伊大学香槟分校Heng Ji 教授带来了题为《PaperRobot: Scientific Knowledge Graph Construction and Paper Writing》的报告,分享了她们在利用知识图谱进行论文阅读理解、发现新研究思路以及自动构写论文摘要等方面的研究成果。加拿大滑铁卢大学李明教授以《第三代聊天机器人》为题作了精彩分享,他介绍了现有聊天机器人存在的不足,提出第三代聊天机器人架构和可行的实现方法。百度首席技术官王海峰博士作了《知识图谱与语义理解》的报告,介绍了百度在知识图谱与语义理解技术及应用方面的工作,并对其未来发展方向做了进一步探讨。
最佳中英论文出炉
本届大会收录论文53篇,其中Oral论文13篇,Poster论文40篇。《基于简介文本的中文人物关系图谱属性补全与纠错》获得了本次大会的中文最佳论文,作者是苏州大学计算机科学与技术学院的杨一帆、马进、 王海涛、 何正球、陈文亮、张民。
该文描述了从百科类数据构建人物关系图谱的过程,作者对人物属性和关系进行了归一化处理,为提高图谱的覆盖率和正确率,从文本中进行自动学习知识的纠错和补全,最终获得了包含百万级人物实体和千万级三元组的人物关系图谱。该文采用模式匹配和统计模型相结合的策略从文档数据中自动学习补全和纠错属性,最终提高了知识图谱的正确率和覆盖率。
《Copy-Enhanced Contextual Information Learning for Dialogue State Tracking》获得了本次大会的英文最佳论文奖,作者是 Qingbin Liu、 Shizhu He、 Kang Liu、 Shengping Liu 、Jun Zhao,来自中国科学院自动化研究所模式识别国家实验室和北京云知声信息技术有限公司。
该文提出了一个复制增强的异构信息学习模型,该模型具有多个编码解码器用于DST(CEDST),通过复制异构文本中的值,可以有效地生成所有可能的值,包括未知值。同时,CEDST可以通过多个编码器将大状态空间有效地分解为多个小状态空间,并利用多个解码器充分利用减少的空间生成值。多编码器-解码器体系结构可以显著提高性能。实验表明,CEDST可以有效地减少空间生成值,同时CEDST在WoZ2、bAbI和他们构建的数据集上都实现了最优性能。
知识图谱评测竞赛奖项花落各家
CCKS每年都会面向公众发布评测任务,这一系列评测旨在为研究人员提供测试知识图谱与语义计算技术、算法及系统的平台和资源,促进国内知识图谱领域的技术发展,以及学术成果与产业需求的融合和对接。
经过前期的评测任务征集和评测组委会筛选,CCKS 2019共设立6个相关主题评测任务,分别是:面向中文电子病历的命名实体识别、面向中文短文本的实体链指任务、人物关系抽取、面向金融领域的事件主体抽取、公众公司公告信息抽取以及开放领域的中文问答。专委会为每个任务前三名设立了奖金并颁发证书,同时组委会针对不同任务特别评选出了“创新技术奖”,专门用于鼓励创新性技术的使用。
据统计,今年共有1666支队伍报名参加了评测任务,参赛队伍数量是去年的6倍(2018年,288支),最终有698支队伍提交结果。同时,本次大会还收到39篇评测论文投稿,录用论文30篇,口头报告12篇,海报展示28篇。
测评任务报名情况评测任务一:面向中文电子病历的命名实体识别,阿里健康的Alihealth团队获得了子任务1的一等奖,国防科技大学计算机学院的NUDT-YH团队获得子任务2一等奖。技术创新奖由清华-讯飞联合实验室MSIIP队获得。
评测任务二:面向中文短文本的实体链指,第一名获得者是东北大学的FREE团队;技术创新奖由同济大学烟雾弹大师法棍诺团队获得。
评测任务三:人物关系抽取,Sent-Track和Bag-Track的一等奖分别由国双科技的格物致知团队和Lenove Research的LEKG团队获得,技术创新奖则被东北大学NEU_DM1收入囊中。
评测任务四:面向金融领域的事件主体抽取,第一名被哈工大(深圳)-图灵联合实验室的糯米糍团队拿下,技术创新奖由广东外语外贸大学GDUFSER获得。
评测任务五:公众公司公告信息抽取,一等奖和技术创新奖均被美能华智能科技包揽。
评测任务六:中文知识图谱问答,第一名被百度智珠尹存祥团队收获,技术创新奖由华为SUDA团队获得。
主会还包括知识图谱顶级会议回顾及研究进展报告,优秀学术论文报告,学术论文口头报告,Poster Spot Highlight,知识图谱工业界论坛等环节,邀请了国内外专家学者讲授相关领域的最新进展、发展趋势和实战经验。作为本次大会的亮点,知识图谱工业界论坛设立了企业知识图谱、金融知识图谱、工业及公安知识图谱、医疗知识图谱四个分论坛,华为、滴滴、美团、小米、阿里等产业界的研发人员带来了16场精彩报告,分享了他们在知识图谱构建、应用和测评方面的实践经验,促进产学研的合作。
CCKS2020将于明年在江西南昌举办,江西师范大学计算机信息工程学院作为大会的承办方将为我们带来更为精彩的学术与技术盛宴,让我们共同期待明年盛会的到来。