破解幽默感再下一城,斯坦福研究人员推出利用模型抖同音不同义包袱
以下是论文概要:我们解决了在给出一对同音词(例如,「死亡」和「染色」)的情况下产生双关语句的问题。由于缺乏大量的双关语,监督式文本生成则并不适用于此类场景,即使存在如此的语料库,模仿也与生成新颖内容也会截然不同。在本文中,我们提出了一种无监督的惩罚生成方法,使用无文本语料库和我们称之为局部全局的原则:在双关语句中,双关语词之间存在强烈关联(例如,「染色「)和南辕北辙的语境,以及替代词(例如,」死亡「)和直接语境之间的强烈关联。这种对比能够使人意外,从而觉得幽默。我们以两种方式实例化这种用于双关语生成的原则:(i)作为基于语言模型下的概率比率的度量,以及(ii)基于 skip-gram 模型建议的单词的检索和编辑方法。人类评估表明,我们的检索和编辑方法在 31%的时间内成功地生成了双关语,使神经生成基线的成功率增加了三倍。