Abstract: 汉语是一种意合型语言,汉语中语素的构词方式与规律是描述、理解词义的重要因
素。关于语素构词的方式,语言学界有语法构词与语义构词这两种观点,其中,语义
构词对语素间关系的表达更为深入。本文采取语义构词的路线,基于语言学视角,考
虑汉语构词特点,提出了一套面向计算的语义构词结构体系,通过随机森林自动标注
与人工校验相结合的方式,构建汉语语义构词知识库,并在词义生成的任务上对该资
源进行计算评估。实验取得了良好的结果,基于语义构词知识库的词义生成BLEU值
达25.07,较此前的语法构词提升了3.17%,初步验证了这种知识表示方法的有效性。
该知识表示方法与资源建设将为人文领域和信息处理等多方面的应用提供新的思路与
方案。
Loading