上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.2.2 情感词典
情感词典,又称情感词汇本体库,是情感计算的重要外部资源,能够为情感计算提供情感词的词性、情感类别、情感强度等信息,对定位文本中的情感词、识别文本的情感类型具有重要的作用。情感词典的好坏直接关系着情感计算领域内各任务的性能。
情感词典的构建方法主要有人工构建和自动化构建两种,人工构建指通过人工标注的手段对文本中重要的情感词汇进行标注,自动化构建则是通过设计计算机能够自动化运行的规则和程序对语言知识库与语料库的信息加以利用来获得情感词的情感信息。与自动化构建方法相比,人工构建的情感词典具有更高的标注质量和可靠性,但受限于人力成本,其规模通常较小。自动化构建的情感词典具有规模大、内容全的优势,但是不可避免地存在标注错误等问题。
常见的英文情感词典有斯通等人于1960年构建的General Inquirer Lexicon,埃苏里等人在WordNet基础上构建的SentiWordNet,胡岷青等人构建的Opinion Lexicon以及Saif Mohammad等人构建的Emotion Lexicon[10]。大连理工大学信息检索实验室构建的中文情感词汇本体库则是一个常用的中文情感词典[11]。