论文标题:
Leading Conversational Search by Suggesting Useful Questions
论文来源:
WWW 2020
论文链接:
https://www.microsoft.com/en-us/research/uploads/prod/2020/01/webconf-2020-camera-rosset-et-al.pdf
一、简介
本文由微软 AI 研究院发表于 WWW 2020,当前对话式搜索引擎主要存在两个挑战:1. 用户仍然习惯使用查询词而并非自然语言进行搜索;2. 搜索引擎的能力需要超出仅解决当前查询的问题。
本文提出了对话式问题建议(Conversatioal question suggestion)这一新的方式,帮助用户通过更接近于对话式检索的方式,获得更好的搜索体验。
二、从相关性到有用性
Misses Intent:该问题完全和主题不符,或者不是用准确的自然语言进行表达。
Too Specific:问题过于具体,导致能覆盖的人群较少。
Prequel:问题的答案是用户已知的内容。
Duplicate with Query:提问和查询完全重复。
Duplicate with Answer:提问可以被当前查询中所显示的结果解答。
三、问题推荐框架
二者均在以下四个任务上完成训练:
相关性分类:该任务针对一个具体的“查询-问题对”判断它们是否相关,是一个二分类问题。 相关点击率预测:该任务抽取了同一查询下,两个具有点击率显著差异的问题(30%以上),目标是模型能准确预测出点击率更高的问题。 点击预测:该任务针对一个具体的“查询-问题对”,判断在显示该查询的情况下,该问题是否会被点击,是一个二分类问题。该任务可以被认为是该模型的主任务。 用户搜索轨迹模拟:该部分首先抽取出一些真实搜索引擎中的会话,并借助下一查询预测任务,使得我们的模型预测下一查询中的用户意图。具体来说 GPT-2 模型直接根据之前的查询生成下一查询,而 BERT 模型则对最可能出现的模型进行排序筛选。
四、实验
本文首先提出了对话式问题建议(Conversatioal question suggestion)这一新的方式,帮助用户获得更好的搜索体验。本文此后提出了更加合理的评价指标 usefulness 替代 relevance,以衡量建议问题的性能。