讲者介绍
曾祥荣:中国科学院自动化所模式识别国家重点实验室博士生,主要研究方向是自然语言处理中的关系抽取。目前已经在AAAI和ACL发表长文两篇。
报告题目:关系抽取:从“简单”到“复杂”
报告摘要:关系抽取致力于从给定非结构化文本(句子)中识别出两个实体之间的关系。根据给定信息的不同,可以分为关系分类和关系抽取两个子任务。我们从相对简单的关系分类任务开始,介绍该任务的定义和经典的模型。然后介绍更复杂一些的关系抽取任务。主要包括与关系分类任务的不同之处以及该任务中的经典模型。最后介绍关系抽取任务中更复杂的情况,即单个句子包含多个关系事实的情形。这部分会讨论为什么之前的关系抽取模型在这种情形下不适用,以及我们是如何来解决这个问题的。
杨振:中国科学院自动化研究所博士,研究方向为神经机器翻译,主要研究内容包括模型算法优化,低资源情况下的机器翻译算法研究,首次将对抗网络应用于机器翻译领域并取得了较大的性能提升。在NLP领域顶级学术会议ACL, NAACL, COLING等会议和期刊上发表论文十篇,曾获AI Challenger全球创新挑战赛英中机器同声传译冠军,英中机器文本翻译亚军。
报告题目:低(无)资源情况下的神经机器翻译
报告摘要:随着神经网络的发展,基于深度学习的机器翻译系统(神经机器翻译)在大量翻译任务上已经取得了(远远)超越传统基于统计的机器翻译系统的性能。神经机器翻译模型的巨大成功,严重依赖于大规模、高质量的双语语料。然而,获取这些大规模的双语语料需要花费大量的人力和财力,甚至在某些极端情况下,双语语料根本无法获得。因此,研究如何在只有少量双语语料(低资源),甚至在没有双语语料情况(无资源)下,如何训练高性能的神经机器翻译模型,成为学术界和工业界广泛关注的问题。