深度学习时代,传统 NLP 中的语言知识库是否就不再有用了呢?在最新一期的 INTERFACE 中,清华大学刘知远副教授将为我们介绍在深度学习模型中应用 HowNet 知识的探索和未来展望。
演讲主题:在深度学习时代用 HowNet 搞事情
演讲摘要:HowNet 是董振东、董强先生父子毕数十年之功标注的大型语言知识库,秉承还原论思想,认为词汇/词义可以用更小的语义单位来描述,这种语义单位被称为「义原」(Sememe),顾名思义就是原子语义,即最基本的、不宜再分割的最小语义单位。在不断标注的过程中,HowNet 逐渐构建出了一套精细的义原体系(约 2000 个义原)。进入深度学习时代,人们发现通过大规模文本数据就能很好地学习语义表示,取得比传统基于语言知识库的方法还好的效果。那么语言知识库是否就不再有用了呢?我们坚信,AI 未来的科学突破是建立一种同时基于知识和数据的 AI 系统。针对 NLP 深度学习模型的关键问题就在于,利用什么知识,怎样利用知识。这个报告将介绍我们在深度学习模型中应用 HowNet 知识的探索和未来展望。
个人简介
刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011 年获得清华大学博士学位,已在 ACL、IJCAI、AAAI 等人工智能领域的著名国际期刊和会议发表相关论文 60 余篇,Google Scholar 统计引用超过 2100 次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel 青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI 期刊 Frontiers of Computer Science 青年编委,ACL、COLING、IJCNLP 领域主席。
演讲时间:2018年5月26 日
14:00-14:30 签到
14:30-15:30 嘉宾分享
15:30-16:00 现场提问、交流
地点:北京市海淀区中关村鼎好 a 座三楼太库科技路演厅
报名链接:http://t.cn/R3K5byV