上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第2章 语义相似度计算的相关理论
在自然语言处理领域,一些任务应用的核心在于如何度量两个词或文档之间的相似性,例如,信息检索。而在传统的信息检索系统中,词和文档的相似度判断依赖于严格的关键词匹配,忽视了词汇之间或文档之间的潜在“语义关系”或“语义距离”,就会导致检索结果无法理解和满足用户的真正需求。因此,要大量研究针对文档或词库的高维语义空间,对其进行抽象分解表示,从而将自然语言的形式化表示进行量化,以此衡量文本之间的相似度,提高信息检索等任务的效果。本章主要介绍语义相似度计算有关的背景知识、技术和方法,包括文本语义相似度计算借助的语义资源、文本的表示方式、基于图结构的概念语义相似度和基于向量空间的单词语义相似度。