斯坦福最新 NLP 研究:什么是良好的对话? 可控属性如何影响人类的判断
斯坦福大学今天发表了他们最新的研究:什么是好的对话?良好的对话需要在简单和细节之间平衡;没有偏题也可以适度地发散;提问并回答问题。 尽管对话智能体通常是通过人类对整体质量的判断来评估的,但质量与这些个体因素之间的关系却没有得到很好的研究。 在这项工作中,我们研究了两种可控的神经文本生成方法,即条件训练和加权解码,以便控制聊天对话的四个重要属性:重复,特异性,响应相关性和问题询问。 我们进行了大规模的人工评估,以测量这些控制参数对 PersonaChat 任务上的多轮互动对话的影响。 我们详细分析了它们与对话的高级方面的关系,并表明通过控制这些变量的组合,我们的模型在人类质量判断中获得了明显的改进。