SFFAI55 - 杜纯宁《基于胶囊网络的细粒度情感分析》
SFFAI55 - 韦鹏辉《基于会话结构和时序动态建模的用户立场与消息真实性联合预测》
关注微信号:人工智能前沿讲习,回复“杜纯宁”,韦鹏辉”获取讲者PPT资料。
EMNLP是自然语言处理领域的顶级会议,由 ACL 学会下属特殊兴趣小组 SIGDAT组织,每年召开一次。EMNLP 如今已成为自然语言处理,特别是统计自然语言处理领域的学术盛会。2019 年的 EMNLP 联合 IJCNLP 一同召开,所以会议统称为 EMNLP-IJCNLP 2019。本期论坛我们邀请了两位EMNLP-IJCNLP 2019论文作者,来分享他们工作中的思考与创想。
讲者介绍
杜纯宁:北京邮电大学在读博士,主要研究方向自然语言处理、情感分析、胶囊网络。
报告题目:基于胶囊网络的细粒度情感分析
报告摘要:细粒度情感分析旨在分析自然语言中面向特定目标的情感,是情感分析任务中目前最有挑战的任务之一。其主要困难在于一段话中会有多个评论目标,并且很可能表现出多种情感倾向。如何有效地分离这些情感特征成为最大的挑战。常规的基于神经网络的方法通常使用池化或者注意力机制来寻找特定的情感词,但是还不足以聚合这些不同极性的情感词到相应的目标。为了解决这些问题,我们提出使用胶囊网络构建向量化的特征,同时使用EM动态路由算法替代池化操作,动态路由可以通过聚类的方式分离重叠交叉的特征。更进一步地,我们设计了交互式注意力机制在路由算法中,加强目标词与上下文的关系。在三个主流的细粒度情感分析数据库下(SemEval 2014, Twitter),我们的方法均取得了最好的结果。
Spotlight:
- 本文是胶囊网络在自然语言中的探索。是胶囊网络首次在细粒度情感分析中的应用;
- 我们给胶囊网络的动态路由算法融入了交互式注意力机制,加强了目标和文本之间的关系。
韦鹏辉:中国科学院自动化研究所在读博士生,2016年本科毕业于武汉大学。主要研究兴趣为面向社会媒体的观点挖掘方法及应用,曾在EMNLP、SIGIR、AAAI发表一作论文。
报告题目:基于会话结构和时序动态建模的用户立场与消息真实性联合预测
报告摘要:现今社会媒体上充斥着大量的真实性有待核实的内容,此类消息的广泛传播产生了极大的社会危害。待查事实(Rumor)指的是发布前未经核实的消息,其真实性存在如下三种情况:真、假、仍无法核实,真实性为假的消息即为我们日常语境下所称的“谣言”。本次报告关注的研究任务为对待查事实消息的真实性进行预测。早期研究发现,社会媒体用户对于待查事实所表达出的立场倾向性(支持、否认、怀疑等)可以作为预测消息真实性的重要线索,因而将预测用户立场作为真实性预测的一个前置步骤,在外部证据不足的情况下利用“群体智慧”(Crowd wisdom)来进行预测。以往的研究工作主要存在以下三点问题:在用户立场预测的建模过程中,将用户回复形成的会话树结构打破为分支序列结构,造成局部上下文丢失;在消息真实性预测的建模过程中,立场信息作为重要的指示性信号却未被充分利用;立场预测与真实性预测这两个呈前后级联关系的任务往往被分开建模。本次报告将回顾相关研究,并介绍发表于EMNLP 2019的工作,试图应对上述三点问题:使用改进的图卷积网络建模会话结构来预测用户立场;基于用户立场随时间推移所呈现的动态演化特点,建模其时序动态性来预测消息真实性;采用层次化多任务学习来对两个级联式的任务进行联合建模。所提出的方法在两个Twitter数据集上均取得了目前最佳的效果。
Spotlight:
- 提出了改进的图卷积网络对用户回复形成的会话结构进行建模,预测用户立场倾向性;
- 根据用户立场的动态演化特性,结合内容特征与立场特征来预测消息真实性,并将该部分与立场预测集成到一个端到端的网络中;
- 两个Twitter数据集上的实验结果表明所提出的方法在立场预测和真实性预测上均取得了目前最佳的效果。
论文推荐
Dynamic Routing Between Capsules
推荐理由:Hinton先生于NIPS 2017发表的胶囊网络论文,首次提出动态路由的概念,具有很大的启发性。
Investigating Capsule Networks with Dynamic Routing for Text Classification
推荐理由:胶囊网络在自然语言处理的第一次探索,提供了胶囊网络解决自然语言处理任务的基础,发表于EMNLP 2018。
Towards Scalable and Reliable Capsule Networks for Challenging NLP Applications
推荐理由:胶囊网络最新成果,发表于ACL2019。对部署与优化有了新的发展,设计了动态路由的迭代次数的自适应算法。对胶囊网络的大规模应用有了进一步的探索。
Detection and Resolution of Rumours in Social Media_ A Survey
推荐理由:这是一篇发表于2017年ACM Computing Surveys的综述论文,详尽地梳理了面向社会媒体的待查事实消息真实性预测的相关研究工作。该综述极大地推进了报告人在入坑这个任务后的文献调研进度。
《BLCU NLP at SemEval-2019 Task 7 An Inference Chain-based GPT Model for Rumour Evaluation》《BUT-FIT at SemEval-2019 Task 7 Determining the Rumour Stance with Pre-Trained Deep Bidirectional Transformers》《eventAI at SemEval-2019 Task 7 Rumor Detection on Social Media by Exploiting Content, User Credibility and Propagation Information》
推荐理由:这是三篇打包推荐的最新论文,均为2019年SemEval评测任务的系统报告。前两个系统利用自然语言处理领域近两年来非常流行的contextualized embedding方法(BERT、GPT)进行特征提取,在立场预测任务上取得了前两名;第三个系统从文本内容、消息传播路径、立场信息等多个方面分析了假消息的特点并用以指导特征工程,以绝对优势在真实性预测任务上获得第一名。