本栏目每周将推荐若干篇由师生精心挑选的前沿论文,分周三、周五两次推送。
本次推荐了三篇关于评价对象、情感分类、知识图谱、机器翻译和层次化的论文。
1、推荐组:SA
推荐人:王帅(研究方向:情感分析)
论文题目:Transformation Networks for Target-Oriented Sentiment Classification
作者:Xin Li, Lidong Bing, Wai Lam and Bei Shi
出处:ACL 2018
论文主要相关:评价对象、情感分类
简评:Target-Oriented 在其他论文中也被称为aspect-based、aspect-level等,输入为(aspect,sentence),输出为sentence关于该aspect的情感趋向。首先,本文中给出了一种名为TST(Target-Specific Transformation)结构,与传统使用注意力机制等方法利用对象信息的方法不同,TST可以根据对象信息对句子中每个词生成一个与该对象相关的特制表示,对于短语型的对象,TST还会确定短语对象中各个词的重要性,来确定对象的表示;其次,为了防止多层TST使原本的上下文信息丢失,本文给出了Lossless Forwarding和Adaptive Scaling两种文本保留机制;最后,本文使用了CNN做最后的特征抽取工作,鉴于CNN在多对象的句子中难以判断对象与评价词之间的对应关系,本文假设与对象距离越近的词相关度越高,利用位置信息给CNN判断对应关系的指导。实验结果在多个数据集上达到最优,且证明了以上三个方法都优化了模型。
论文链接:
https://arxiv.org/pdf/1805.04893.pdf
2、推荐组:SP
推荐人:廖阔(研究方向:事理图谱)
论文题目:Knowledge Graph Embedding with Iterative Guidance from Soft Rules
作者:Shu Guo, Quan Wang, Lihong Wang, Bin Wang, Li Guo
出处:AAAI 2018
论文主要相关:知识图谱
简评:知识图谱嵌入(knowledge graph embedding)是近期知识图谱研究的热点方向,目标是将知识图谱中的实体及关系嵌入到低维连续向量空间中,在保留知识图谱结构信息的同时简化对图谱的操作。生成的embedding包含了丰富的语义信息,可以应用于关系抽取、推荐系统等任务中。本文提出了新的知识图谱embedding计算方法RUGE(RUle Guided Embedding),该方法将知识图谱建模为“实体-关系-实体”三元组,重复迭代下述步骤完成对embedding的训练:(1)由图谱中已知得分的三元组及规则,为图谱中未出现的三元组生成预测得分;(2)使用当前embedding为每个三元组生成计算得分,并使用梯度下降法最小化计算得分与预测/实际得分的距离来对embedding进行更新。步骤(2)中交叉熵的计算使用了步骤(1)中由规则生成的预测得分,因而将规则信息引入了embedding的训练中。这个模型最大的创新之处在于引入软规则,为每个规则赋予了置信度,将置信度低于1的规则加入训练,引入了更多规则信息;并用迭代替代了规则信息的单次注入,更加有效地将规则信息融入到embedding中。作者在FB15K和YAGO37数据集上进行了链条预测任务的实验,取得了SOTA的效果。
论文链接:
https://arxiv.org/pdf/1711.11231.pdf
源代码链接:
https://github.com/iieir-km/RUGE
3、推荐组:TG
推荐人:孙卓(研究方向:文本生成)
论文题目:Chunk-Based Bi-Scale Decoder for Neural Machine Translation
作者:Hao Zhou, Zhaopeng Tu, Shujian Huang, Xiaohua Liu, Hang Li, Jiajun Chen
出处:ACL 2017
论文主要相关:机器翻译、层次化
简评:在传统的机器翻译中,解码器会逐字的生成一个句子。本文提出了一种新型的解码器,可以层次化的生成译文,其分成块粒度(chunk)以及词粒度(word)两个层级进行解码操作,在两个不同的时间尺度上对他们进行学习和更新。具体的说,目标句子被分层的从块转换为单词,解码器首先进行块(chunk)粒度的短语建模,然后在此基础上多个单词(word)粒度被生成。块(chunk)级别的解码器负责在全局即chunk块间的信息进行建模,词(word)级别的解码器负责在该词所在块内的信息进行建模。实验表明该方法在多种语言上都能显著提高翻译效果。
论文链接:
https://arxiv.org/pdf/1705.01452.pdf
源代码链接:
https://github.com/nyu-dl/dl4mt-tutorial