2.3 知识组织体系相关标准
知识组织体系的相关标准是对知识组织活动实践经验总结的凝练与升华,不同类型的知识组织体系,其标准的侧重点也略有不同。所以,本节将从知识组织体系的各个方面来阐述知识组织体系标准化的现状。
2.3.1 知识组织体系编制标准
在各种类型的知识组织体系当中,叙词表的发展尤其受到国际标准界的重视。叙词表标准最开始的发展是受到了第二次世界大战的刺激,当时,文件资源急剧增长,社会上,特别是科学界及商界,对资源存储及检索方面表现出迫切的需求。Dextre Clarke等学者指出1967年的《工程与技术术语叙词表》(TEST)在当时最具代表性和影响力,它的出现,取代了较早的美国工程师联合会(Engineers Joint Council)的《工程术语叙词表》,形成了标准的叙词表格式,成为第一个美国及国际叙词表标准的基础。此外,另一个具有显著影响的叙词表标准是Derek Austin和Dale合写的《UNESCO单语种叙词表的制定和发展指南》(UNESCO's Guidelines for the Establishment and Development of Monolingual Thesauri),该标准后来成为1986年版的国际标准ISO 2788的一部分。
早期主要是针对单语种叙词表方面的标准。1974年,国际标准ISO 2788《单语种叙词表编制导则》(Guidelines for the Establishment and Development of Monolingual Thesauri)发布,其第2版于1986年发布。它是第一部叙词表编制的国际标准,奠定了叙词表编制标准的基础,其中的一些方法和导则一直被往后的标准沿用。此外,美国标准ANSI Z39.19也于1974年出版。英国标准BS 5723以ISO 2788为基础,于1979年颁布。直到1985年,关于多语种的第一部标准ISO 5964《多语种叙词表编制导则》才得以颁布。ISO 5964是第一部跨语言的叙词表编制标准,可以视为ISO 2788在语言方面的补充与扩展。同年,英国标准BS 6723:1985发布,等同于ISO 5964—1985。1986年,ISO 2788—1974更新,英国标准BS 5723亦随之于1987年更新。美国标准ANSI Z39.19:1974先后于1993年和1998年更新。与单语种叙词表相比,多语种叙词表编制所面临的最大问题是不同语言叙词的对应与转换。
2.3.2 知识组织工具相关标准
传统的知识组织工具主要有两大类:一类简称为分类法;另一类简称为主题法。由于传统的知识组织工具主要应用于图书馆或档案馆等领域,随之而产生的相关标准也成为这一特定领域内的标准。主要代表标准见表2-1。
表2-1 知识组织工具相关标准
2.3.1.1 图书分类表
目前全球使用最广的分类法是于1876年首次出版的《杜威十进分类法》(DDC)。DDC已被全球超过135个国家的图书馆使用,并且被翻译为逾30种语言。在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆以及20%的专门图书馆使用DDC。此外,DDC更能用来组织网际网络上的各种资源。尽管DDC在其各个版本之间还存在不一致或冲突的地方,但是使用机构通常将其视为标准。除此之外,《国际十进分类法》(UDC)和《国会图书分类法》(LCC)也是历史悠久的知识组织工具,并衍生出各个版本。另外,《中国图书馆分类法》(简称《中图法》)是我国当今国内图书馆使用最为广泛的分类法体系。
2.3.1.2 主题标目表
《国会图书馆主题标目表》(Library of Congress Subject Headings, LCSH)是美国国会图书馆编制的一大型综合性标题表,虽然世界各地的很多图书馆很少全套使用LCSH,也并非十分严谨地使用其组合标目规则,但这并不能改变其使用范围广的状态,所以LCSH本身也可以说是一种标准。
2.3.1.3 规范文档
有些规范文档虽然不是国家或国际标准,但其应用范围非常广,本身即为标准,并不需要外界标准团体的认可,如国际图书馆协会和机构联合会(International Federation of Library Associations and Institutions, IFLA)的《IFLA规范记录和参照指南》,国际档案学会的ICA/CDS国际企业、个人、家族名称规范记录,德国国家图书馆的个人名称Personnennamendatei(PND),英国NCA人名、地名和企业名称规范规则等。
2.3.1.4 图书编目
40多年以前,IFLA在国际范围内,对编目理论与实践进行了一次彻底的梳理,形成了后来称为巴黎原则的一系列编目原则。1969年,在哥本哈根召开的国际编目专家会议上通过了一个关于制定书目著录形式与内容的国际标准的决议,根据这个决议制定了《国际标准书目著录(专著)标准》,并于1971年出版。以上的巴黎原则和ISBD后来成为各种新编的和修订的国家与国际编目标准的基础。
20世纪90年代,编目原则和标准实施的环境发生了巨大变化,传统的编目原则与标准已经满足不了图书编目工作的要求。于是,国际图联世界书目控制与国际MARC(UBCIM)项目和国际图联书目控制部于1990年召开了斯德哥尔摩书目记录专题研讨会,该会议通过了9项决议,其中一项就是研究书目记录的功能需求。为了研究和探讨这一项专题,IFLA专门成立了一个国际研究小组,历时8年,经过多次审议和评论,最终发表了书目记录功能需求的最终报告——Functional Requirements for Bibliographic Records(FRBR)。该标准对传统的编目理论提出了挑战,给国际图书馆编目界带来了深远的影响,《国际标准书目著录》(International Standard Bibliographic Description, ISBD)、《国际编目原则声明》(Statement of International Cataloguing Principles)、《英美编目条例》(Anglo-American Cataloguing Rules, AACR)等随之进行了修订或起草,直到2011年前后才有初步的结果。
2.3.3 知识组织标引标准
知识组织标引标准的发展主要表现在两个方面:其一是主题标引,其二是分类标引。
1985年12月,国际标准化组织发布了ISO 5963—1985《文献工作——文献审读、主题分析与选定标引词的方法》这一主题标引标准,这一标准被英国、法国、西班牙、瑞典、罗马尼亚、南非、丹麦、俄罗斯、澳大利亚、德国、中国等采用为国家标准。我国在此标准的基础上,制定并修改了自己的国家标准GB/T 3860—2009《文献主题标引规则》、DA/T 19—1999《档案主题标引规则》、DA/T 20.2—1999《民国档案主题标引细则》、DA/T 17.3—1995《革命历史档案资料主题标引规则》、NY 201—1991《农业科技档案主题标引规则》等一系列的主题标引规则。这些标准并未完整地采用ISO 5963—1985标准,而是基于本国国情做了改动,所以存在一定差异,但从内容范围、方法、原则等方面来说,是一致的。
国际上对目前分类标引并没有发布统一的标准体系,所以本书着重阐述我国有关分类标引的国家标准。1989年,我国发布了QJ 1648—1989《文献分类标引规则》,实行至今。1994年,发布GB/T 15418—1994《档案分类标引规则》,该标准于2010年被GB/T 15418—2009《档案分类标引规则》替代。此外,还分别发布了NY/T 203—1992《农业科研课题档案分类标引规则》、NY 71—1988《农业科技档案分类标引规则》、DA/T 17.4—1995《革命历史档案资料分类标引规则》、DA/T 20.3—1999《民国档案分类标引细则》等一系列分类标引标准。这些标准从发布至今,经历了数次更新,虽然并非国际标准,有些也并非国家标准,但这正体现了知识组织标引方面的一个标准化的过程。
2.3.4 知识组织体系互操作
知识组织体系互操作相关标准的发展可以从本体互操作和主题图互操作方面来看。2007年3月,国际标准化组织发布了ISO/IEC 19763-3—2007《信息技术—元模型互操作框架(MFI)—第3部分:本体注册的元模型》,该标准被英国和美国采用为国家标准,并于2010年更新为ISO/IEC 19763-3—2010。主题图互操作方面,国际标准化组织于2006年发布ISO/IEC 13250-2—2006《信息技术—主题图—第2部分:数据模型》,2007年发布ISO/IEC 13250-3—2007《信息技术—主题图—第3部分:可扩展语法(XML)句法》,2009年发布ISO/IEC 13250-4—2009《信息技术—主题图—第4部分:规范化》,这三者均被英国和加拿大采用为国家标准。此外,又于2010年发布了ISO/IEC 13250-6—2010《信息技术—主题图—第6部分:简洁语法》。
2.3.5 知识组织体系数据描述标准
互联网时代,为了更好地进行知识描述和知识组织的语义化研究,W3 C(万维网联盟)提出了用来描述网络资源对象及其之间关系的语言规范:RDF(资源描述框架)。随后在此基础上提出了两个知识组织体系的数据描述标准:网络本体语言与简单知识组织系统。
网络本体语言(Web Ontology Language, OWL)是W3C开发的一种用于对本体进行语义描述的语言。2004年,W3C在RDF资源及其关系描述的语言规范基础上提出了OWL的推荐标准,该系列标准规范体系由6个推荐性标准文档组成,分别从理论、实例及规范性定义的角度对OWL进行全面、简洁及规范化的阐述,包括:①《OWL概述》,通过列出网络本体语言的语言特征同时给出其简要的描述,简要介绍网络本体语言;②《OWL参考》,以一种简洁与系统的方式对网络本体语言的所有建模原语进行了描述;③《OWL指南》,通过一个扩展的例子说明如何使用网络本体语言,同时也对这些文档中所用到的术语进行了解释;④《OWL语义与抽象语法》,该文档是对网络本体语言的最终的、形式化的规范性定义;⑤《OWL应用案例和需求》,该文档包含了一个OWL的用例集合和关于网络本体语言的需求集合;⑥《OWL测试用例》,该文档包含了网络本体语言的一个大量的测试用例集合。随后,2007年9月,W3C又成立了OWL工作组,主要从事OWL推荐标准的优化与扩展工作。该工作组于2008年发布了7个公开工作草案规范,对OWL的语法、理论模型以及与RDF的映射、框架等进行说明,形成OWL2。
简单知识组织系统(Simple Knowledge Organization System, SKOS)是一个汇聚不同领域知识、技术和实践的数据共享标准。它是W3C于2005年制定的用于表示如叙词表、分类法、主题词表、术语表等概念框架的推荐标准。2006年至2008年,W3C对SKOS的研究工作还处于草案状态,形成了《SKOS核心指导》《SKOS核心词汇规范》等草案。2008年至2009年3月,W3C根据征求意见多次补充更新,形成了工作草案《SKOS参考》及其指南《SKOS初级读本》,定义了SKOS类或属性名称32个,包括4个类、28个属性。2009年8月18日,W3C发布了新的SKOS标准,该标准在世界各个知识组织系统(包括主题词表、分类法、大众分类法等)和关联数据社区之间建立联系,使用户可以使用SKOS对关联数据的杠杆力量。
以上两个标准是知识组织系统网络化和网络兼容交换的数据标准格式,也是由计算机可读数据转换为网络可读,进而转换为计算机可理解的数据描述语言。