本栏目每周将推荐若干篇由师生精心挑选的前沿论文,分周三、周五两次推送。
本次推荐了三篇关于跨语言,情感分类,词向量,事件检测,文本问答、视觉问答、记忆网络、关系推理的论文。
1、推荐组:SA
推荐人:吴洋(研究方向:情感分析)
论文题目:Bilingual Sentiment Embeddings: Joint Projection of Sentiment Across Languages
作者:Jeremy Barnes, Roman Klinger, and Sabine Schulte im Walde
出处:ACL 2018
论文主要相关: 跨语言,情感分类,词向量
简评:
该论文探讨了如何利用有限的语料资源解决跨语言的情感分类问题。其中提出的BLSE(Bilingual Sentiment Embeddings)模型仅需三种资源,从源语言到目标语言的小型双语词典,源语言端带有情感标签的情感语料库,源语言和目标语言的词向量。BLSE模型一方面通过学习合适的语义映射使得源语言和目标语言中具有相似语义的词在映射后能够距离较近(参数M’,M),另一方面通过在情感语料上进行有监督学习来使得对源语言的映射能够保留情感信息(参数M,P),最后通过两方面的学习来得到有效的跨语言情感分类模型(M’,M,P)。实验结果表明,BLSE模型在二分类上比使用相似的资源的SOTA模型平均高出14个百分点,在四分类上高出4个百分点。
论文链接:
https://arxiv.org/pdf/1805.09016.pdf
源代码链接:
https://github.com/jbarnesspain/blse
2、推荐组:SP
推荐人:张文博(研究方向:社会预测)
论文题目:Graph Convolutional Networks with Argument-Aware Pooling for Event Detection
作者:Thien Huu Nguyen, Ralph Grishman
出处:AAAI 2018
论文主要相关:事件检测
简评:
随着互联网信息爆炸式的增长,从非结构化的信息中提取出有用的结构化信息显得尤为迫切和重要。事件检测作为信息抽取系统中的一个关键任务,受到了很多研究者的关注,然而,以往大部分做事件检测的工作都只是考虑句子的线性表示,忽视了句法结构能够直接联系信息上下文的优势。该论文提出一个基于句法依存树的图卷积神经网络模型用于事件检测,解决了长距离非连续的信息依赖问题,在公开数据集ACE2005上取得了非常好的效果。这个模型最大的创新点是首次在神经网络中引入句法结构特征,在句法依存图上执行卷积操作。句法依存图是通过句法依存树转换得到的——有向边变为无向边且添加自循环边,然后在句法依存图上建模图卷积网络(GCN)进行触发词的识别和分类。GCN模型大致有两种结构:一是先做图embedding转化成序列格式,然后执行传统的平面卷积操作;二是借鉴卷积核局部加权求和的思想,对图中的任一顶点及其邻域进行加权求和,以达到抽取特征的目的。本文采用的是第二种结构的GCN模型,通过对候选词及其句法邻域词进行卷积操作,建模最直接的信息依赖。此外,本文还提出了基于实体提及的池化操作,进一步提升了事件检测的效果。
论文链接:
https://ix.cs.uoregon.edu/~thien/pubs/graphConv.pdf
3、推荐组:TG
推荐人:龚恒(研究方向:文本生成)
论文题目:Working Memory Networks: Augmenting Memory Networks with a Relational Reasoning Module
作者:Juan Pavez, Héctor Allende, Héctor Allende-Cid
出处:ACL 2018
论文主要相关:文本问答、视觉问答、记忆网络、关系推理
简评:
这篇文章主要针对文本问答数据集bAbI-10k和视觉问答数据集NLVR中涉及到的比较复杂的需要关系推理的问题,在Memory Networks(记忆网络)中引入了NIPS 2017上DeepMind发表的一篇针对CLEVR数据集中关系推理问题的论文《A simple neural network module for relational reasoning》中提出的Relation Networks(关系网络)。为了解决在处理长文本时Relation Networks的时间复杂性较大的问题,这篇文章用Relation Network在Memory Networks的每个hop得到的表示之间两两进行推理。这样,Relation Network需要进行推理的次数只与Memory Networks的跳数有关。通过固定Memory Networks的跳数,可以提高Relation Networks面对长文本时的可拓展性。在bAbi-10k数据上相比之前的state-of-the-art有超过2个点的提升,在位置推理(positional reasoning)和路径寻找(path finding)任务上有较好的提升。NLVR数据集上,在不使用句法信息的情况下,达到了与Module Neural Networks可比的结果。
论文链接:
https://arxiv.org/abs/1805.09354