SFFAI 6 | 关系抽取：从“简单”到“复杂”

讲者介绍

曾祥荣：中国科学院自动化所模式识别国家重点实验室博士生，主要研究方向是自然语言处理中的关系抽取。目前已经在AAAI和ACL发表长文两篇。
报告题目：关系抽取：从“简单”到“复杂”
报告摘要：关系抽取致力于从给定非结构化文本（句子）中识别出两个实体之间的关系。根据给定信息的不同，可以分为关系分类和关系抽取两个子任务。我们从相对简单的关系分类任务开始，介绍该任务的定义和经典的模型。然后介绍更复杂一些的关系抽取任务。主要包括与关系分类任务的不同之处以及该任务中的经典模型。最后介绍关系抽取任务中更复杂的情况，即单个句子包含多个关系事实的情形。这部分会讨论为什么之前的关系抽取模型在这种情形下不适用，以及我们是如何来解决这个问题的。

杨振：中国科学院自动化研究所博士，研究方向为神经机器翻译，主要研究内容包括模型算法优化，低资源情况下的机器翻译算法研究，首次将对抗网络应用于机器翻译领域并取得了较大的性能提升。在NLP领域顶级学术会议ACL, NAACL, COLING等会议和期刊上发表论文十篇，曾获AI Challenger全球创新挑战赛英中机器同声传译冠军，英中机器文本翻译亚军。
报告题目：低（无）资源情况下的神经机器翻译
报告摘要：随着神经网络的发展，基于深度学习的机器翻译系统（神经机器翻译）在大量翻译任务上已经取得了（远远）超越传统基于统计的机器翻译系统的性能。神经机器翻译模型的巨大成功，严重依赖于大规模、高质量的双语语料。然而，获取这些大规模的双语语料需要花费大量的人力和财力，甚至在某些极端情况下，双语语料根本无法获得。因此，研究如何在只有少量双语语料（低资源），甚至在没有双语语料情况（无资源）下，如何训练高性能的神经机器翻译模型，成为学术界和工业界广泛关注的问题。

参考资料

https://www.bilibili.com/video/BV1ft411D7VU/

https://bbs.sffai.com/d/15