我系智能交互与认知工程上海高校重点实验室赵海副教授在自然语言处理领域的2篇论文,将以长文形式发表在2016年8月7日-12日于柏林召开的第54届计算语言学学会年会(the
54th Annual Meeting of the Association for
Computational Linguistics, ACL 2016)上。这两篇论文的第一作者均为赵海副教授指导的我系一年级硕士研究生。ACL是国际计算语言学界的顶级会议,CCF-A类论文,2009-2015年录取率在19-26%之间。今年录取长文240篇。
以下是这2篇论文的简介:
1. 中文的神经网络词切分学习
作者:蔡登, 赵海*
简介:对于中文分词来说,大部分的方法都将这个问题看作是对于每个汉字的串标注问题,而这样会带来需要确定固定窗口,并难以捕捉序列标注之间交互。本文中,作者提出了一种新型的神经网络模型来直接解决上述问题,该模型不需要设定固定的窗口大小并且能够对完整的分词历史进行建模。具体来说,一种基于门的神经网络也用于从字到词的组合过程,而词的表示则通过长短期记忆网络完成句子层面的建模。通过在标准数据集上的评估,该模型在不需要特征工程的情况下达到了国际领先水平。
2. 基于卷积神经网络的概率化图依存分析
作者:张智松, 赵海*, 覃莲卉
简介:本文描述了基于神经网络的概率依存句法分析模型,该模型使用了基于条件最大概率的训练目标并且能够扩展到高阶模型。同时,文章使用了两种神经网络方面的拓展:一是使用卷积神经网络对句子建模并用于子分析树打分,二是将不同阶数的模型通过最后的线性层再次组合起来。在标准的宾州树库语料上的评估表明,该模型能够达到具备竞争力的性能。