Transformer落地:使用话语重写器改进多轮人机对话
这是一篇发表于自然语言处理顶会 ACL 2019 的论文《Improving Multi-turn Dialogue Modelling with Utterance ReWriter》,数据集以及 LSTM 版本的模型可在以下链接找到(由于 Transformer 版本模型已被线上应用,涉及到法律问题未进行开源,但作者欢迎发邮件进行探讨)。这篇论文提出把话语重写作为预处理,帮助多轮对话建模。具体来说就是每句话都要先重写,以恢复所有共指的和省略的信息,然后基于重写的话语执行下一个处理步骤。为了正确地训练话语重写器,本文收集一个新的带有人工注释的数据集并介绍了一个基于 Transformer 的使用指针网络的话语重写架构。本文所提出的架构在话语重写的任务上实现了极其出色的效果。训练好的话语重写器可以很容易地集成到在线聊天机器人。