图书馆电子资源采购的规范管理与控制
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1 绪论

1.1 电子资源的发展

1.1.1 电子资源的概念

文献载体的变化一直与人类知识的萌生同步,又随科学技术的发展而不断更迭,从甲骨文献到丝帛文献,再到纸质文献和电子文献,皆同一理。电子文献大约产生于20世纪60年代,70年代末随着因特网、万维网的迅速崛起及数字化技术的发展而发展,90年代随着全球数字化浪潮的风起云涌和数字图书馆建设步伐的增速而迅速发展起来。作为文献资源收藏的重要机构,各类图书馆大约在20世纪90年代初开始较大规模地收藏电子文献,电子资源日益成为各类图书馆馆藏的重要组成部分。按照相关数据[1],美国研究型大学图书馆电子资源1993年在全部馆藏中占比为3.6%,2003年占比增加到25%,2006年占比增加到43%。到2010年,相当多的美国研究型图书馆的电子资源占比已经远超50%,一些工程技术类研究型图书馆不再购买纸质资源,甚至经过数字化,不再有纸质资源,演变为纯数字图书馆。在国内,按照教育部高校图工委高校图书馆年度发展报告的数据,2009年国内高校图书馆馆均电子资源使用经费占到了馆均文献资源购置费的32%[2],2010年达到48%[3],2015年达到51%,2016年上升为54%[4],电子资源经费保持较高增幅。

关于电子资源,百度百科给出的解释为[5]:以数字化形式把文字、图像、声音、动画等多种形式的信息存储在磁盘、光盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。简而言之,电子资源就是利用电子技术存储、传播的各类信息资源的总称。国际图书馆协会联合会(International Federation of Library Associations and Institutions,IFLA)在2012年发布的《电子资源馆藏发展的关键问题:图书馆指南》中对电子资源给出的解释为:电子资源是指那些需要通过计算机访问的资料,无论是通过个人电脑、大型机还是手持移动设备。它们既可以通过互联网远程访问,也可以本地使用。常见类型有:电子期刊、电子图书、全文(集成)数据库、索引文摘数据库、参考数据库(传记、词典、指南、百科等)、数值和统计数据库、电子图像、电子音频/视频等。[6]两个概念解释的侧重点有所不同,一个注重电子资源的存在传播形式,一个侧重于电子资源的常用类型,二者相结合便能囊括图书馆电子资源的相关含义。

与纸质资源相比,电子资源形式更加多样化,内容也更为丰富,占用空间更小,利用突破了物理位置的限制,更便于快捷阅读和共享。电子资源的出现对整个图书馆事业的发展产生了非常大的影响:(a)电子资源逐渐改变了用户的阅读习惯及文献利用习惯。越来越多的用户在获取文献时,优先考虑可以快速、方便传输的电子文献,也习惯了使用电子文献的复制、粘贴、截图、文字识别等功能;越来越多的用户开始利用电子书阅读器阅读电子图书,也开始习惯在电子图书上进行批注。用户这些阅读习惯和文献利用习惯,伴随着台式电脑、笔记本电脑、阅读器、智能手机、Pad的流行而日益加强。部分图书馆新生代用户,尤其是理工类学科的用户,基本上只依靠电子资源进行学习、研究和工作。文史类学科的相关用户也在获取电子图书、共享其他人手中的电子图书,有些人甚至自己数字化自己所获取的纸质图书,使其变成电子图书。电子资源成为相当多用户资源利用的首选。用户阅读习惯的变化要求图书馆不断增加电子资源购买和馆藏数字化,也要求不断调整和增加利用电子资源为用户服务的项目。(b)电子资源改变了图书馆馆藏结构和建设策略。随着电子资源的类型、内容、提供商等持续增加,图书馆对电子资源购买的力度仍在增加,相当多的图书馆电子资源采购经费已经远超纸质资源,资源数量也在突飞猛进,即便是有百余年纸质馆藏累计的国内大型图书馆,只用了十几年时间电子资源在数量上就已经超越了纸质馆藏,成为各大型图书馆的主要馆藏内容。电子资源的增加不仅改变了图书馆的馆藏结构,也在改变着图书馆的馆藏建设方式:资源描述方式发生变化,业务流程发生变化,长期以来累积的纸质资源采购经验和理论也都需要调整,电子资源采购工作需要借助于更多的规范化工作提高效率和效果。

1.1.2 相似概念辨析

在图书馆电子资源建设实践和相关理论研究中,经常会出现一些与电子资源类似的概念,如数字资源、电子信息资源、虚拟资源、网络信息资源、数字化资源等,这些概念经常会被混用。为了后文更好地讨论,这里先将这些相似概念之间的区别进行必要的说明。

①电子资源与电子信息资源。从字面意义上来看,电子资源的概念范畴要比电子信息资源的概念范畴大,电子资源和电子信息资源是包含与被包含的关系。作为一个经济学词汇,资源是指某个国家或地区拥有的人、财、物等各种物质要素的总称,主要有自然资源和社会资源两类。社会资源主要包括人力资源、信息资源以及经过劳动创造的物质财富等。由此可见,信息资源只是资源的一部分。但是对于电子资源而言,在当前可以理解的范畴中,电子资源尚无严格意义上的电子自然资源、电子人力资源、电子财经资源等分类。因此,从概念内涵上看,电子资源和电子信息资源可以认为是基本等同的概念。从已发表的研究成果来看,不管是术语出现的时间,还是术语出现的频次,图书情报领域更倾向于使用“电子资源”。“电子信息资源”多出现于信息资源利用(比如文献检索课程和信息素养教育)的相关文献中,而在图书情报之外的领域,“电子信息资源”出现的频次远高于“电子资源”。

②数字资源、数字化资源和电子资源。如前所述,电子资源是以数字化形式存在的资源。因此,从字面意义来看,“数字资源”“数字化资源”和“电子资源”三个概念并没有本质的区别。正如“电子图书馆”和“数字图书馆”这两个在图书馆事业发展不同时期提出的不同概念一样,图书馆“电子资源”“数字化资源”和“数字资源”带有明显的历史痕迹:20世纪90年代之前的图书情报领域文献中多以“电子资源”之名出现,之后随着“数字图书馆”概念和实践大行其道,与之对应“数字化资源”和“数字资源”开始在研究和实践中大量出现,而“电子图书馆”一词逐渐淡出图书情报领域文献,但“电子资源”一词仍被继续使用;“数字化资源”在数字图书馆的“大规模资源数字化”阶段用于指因“图书馆纸质资源数字化而产生的资源”,而“数字资源”多用于指“图书馆原生的以数字形式存在的资源”,由于行业从业者对概念的理解不同,两个概念在一定程度上被混用;随着“大规模资源数字化”阶段的结束,“数字化资源”逐渐被简称为“数字资源”。在图书馆界进行资源数字化的同时,大量商业公司也在协助图书馆或者出版社(含杂志社)或者独立开展数字化工作,并将这些数字化的资源制作成数据库产品销售给图书馆。为了管理这些商家提供的数字资源和整个采购过程,业界逐渐开始利用“电子资源”的概念统称那些通过购买等方式获得的第三方商家的数字资源。不过,由于图书情报从业人员众多,两个概念并没有取得所有人的认同,仍旧在混用,但由于电子资源和数字化资源在资源采访、组织方面差别较大,需要进行必要的区分。[7]本书中讨论的电子资源主要指图书馆所采购的资源,包括各类数据库和未以数据库形式存在的分散的采访资源,这些资源近年一般都是原生数字的资源(Born-digital),比如方正阿帕比的电子图书数据库;年代久远的一般都是数据库运营商数字化的资源(Digital-reformatting),比如JSTOR数据库、超星数字图书馆等。数字化资源则一般指用户或机构对纸质文献进行数字化后产生的资源,比如CADAL的大部分资源,各馆自建的学位论文全文库、对本馆数字化馆藏加工而成的自建数据库。需要说明的是,这里的电子资源和数字化资源是在资源建设研究和实践主题下进行的区分。在电子资源和数字化资源统一管理的强烈需求下,在数字资源整合、数字资源长期保存、数字资产管理等图书情报的研究和实践主题中,数字资源包括电子资源和数字化资源。

③电子资源、网络信息资源和虚拟资源。在当前信息环境下,绝大多数的电子资源都是通过网络对外提供服务,因此在用户端,图书馆购买的电子资源和互联网上存在的免费或收费的网络资源都可以称为网络信息资源。但在图书情报领域的图书馆实践中,二者有区分:电子资源是图书馆已经购买或者授权使用的资源;网络信息资源是图书馆之外的网络资源[8],这些网络信息资源经过图书馆组织加工后成为图书馆虚拟馆藏的一部分。国内21世纪初,复合图书馆研究和建设曾经掀起数年的发展热潮,通过购买等途径获得的电子资源、纸质资源、数字化资源、网络信息资源导航以及其他经过组织的网络信息资源组成的虚拟馆藏,共同组成了复合图书馆的馆藏体系。

1.1.3 电子资源的发展简史

印度图书馆学家阮冈纳赞在“图书馆五定律”的最后一条指明“图书馆是一个生长着的有机体”,图书馆一直以用户需求为导向兼顾充分利用科学技术引导用户需求,按照事业发展的固有规律稳步前行。图书馆馆员一向热衷于科技的发展,并且常常最先将技术应用到工作中。20世纪几乎每一次技术进步都助力图书馆更加方便、快捷、及时地为用户提供服务,图书馆电子资源的产生与图书馆及图书馆馆员对于科技的热衷密切相关。

(1)图书馆最早应用的电子资源——机读目录格式和书目数据库

产生于20世纪60年代中期的机读目录格式被认为是图书馆最早应用的电子资源,比万维网的出现早了整整30年。[9]机读目录格式出现后,图书馆开始利用计算机将原来馆藏的卡片目录转换为可供计算机检索利用的电子目录。为了提高编目工作效率,各类型的联合编目纷纷出现,1971年OCLC推出了后来被称为WorldCat的联合目录数据库,1975年美国俄亥俄州州立大学图书馆推出了用户可用的在线目录。

国内图书馆界囿于科学技术的发展进程较慢,推出图书馆机读目录格式的时间较晚。在我国台湾地区,20世纪80年代初陆续推出中文图书和期刊的机读目录格式。在我国大陆,80年代的重点是西文机读目录格式的研究及中文机读目录格式的研制;80年代中后期,国内大型图书馆开始研制诸多自产自用的小型自动化系统,并开始尝试进行纸质资源的编目和借阅管理。[10]1991年,国内正式推出中文文献的机读目录格式;之后,国内出现了支持中文机读目录格式的大大小小的图书馆管理系统,各个图书馆开始建立电子目录。1997年,全国图书馆联合编目(公共图书馆联合编目)中心和CALIS联机编目(高校图书馆联合编目)中心先后成立,全国性的联合目录数据库的书目数据逐渐丰富和完善。

(2)图书馆电子资源载体形式的变迁

图书馆早期在线目录书目数据库的数据存储载体主要是磁带和磁盘。20世纪80年代初期,国外电子资源数据库已经有了较多能提供相当规模的电子资源的供应商,而国内电子资源数据库建设较晚,80年代中后期也只有少量各馆自建自用的电子数据库,较大规模的图书馆电子资源数据库建设是在90年代中后期。不过国内电子资源载体形式和国外基本一样,只是经历了比较短的过渡期就直接进入远程网络数据库阶段。

早期的电子资源数据库供应商给图书馆提供的是CD-ROM压缩式只读光盘。由于光盘具有高密度存储功能,比同时存在的磁盘、磁带等媒介更耐用,且内容不能修改和删除,可以保护资源供应商的版权,光盘一度成为当时非常流行的电子资源存储和传播形式,大量数据库的数据以光盘形式存储,图书馆需要借助于光盘驱动器、光盘塔等实现对光盘内容的读取并对外提供服务。但是光盘数据库劣势也很明显,那就是不能及时更新,供应商会按照月度、季度,甚至年度更新数据,光盘依靠邮寄方式运输,速度慢且容易造成损坏。

随着互联网的迅猛发展和网络存储设备的发展,光盘数据库很快就退出了历史舞台。各类数据库开始以网络数据库的形式存在,不过,最初图书馆只是利用搭建在本地服务器上的资源应用供局域网内的用户使用,资源供应商将资源保存在图书馆本地存储设备上,以资源镜像的形式提供服务,供应商定期通过现场更新和网络更新的方式更新资源数据库中的数据。资源镜像由于占据的硬件资源越来越多,图书馆本地的存储设备无法满足日益增长的电子资源存储需要。这个时候纯网络环境下的电子资源数据库出现了,图书馆本地已经不再存储该数据库的电子资源,用户通过访问资源提供商网站上的资源来完成自己的需要,图书馆提供用户IP地址范围等信息给资源提供商,资源供应商按照IP地址范围给图书馆用户开通使用的“通道”权限。电子资源至此已经离开了图书馆的“掌控”,电子资源的“拥有”(Own)和“利用”(Access)之争名噪一时。随着时间推移和网络环境的持续改善,图书馆和用户逐渐接受了远程利用的方式,但也萌生了对电子资源长期保存的需求,以保证存储在图书馆之外电子资源在遇到自然灾害、供应商破产等不可抗力时仍旧能被图书馆及其用户使用。近年来,随着云计算技术的发展,资源供应商也在利用云平台技术存储数据库资源,以最大限度地避免电子资源的存储设备在遭遇自然灾害或硬件故障等方面问题时造成资源停用,实现无缝切换,不间断地为图书馆及其用户提供服务。

(3)图书馆电子资源文献类型、加工深度等方面的变化

总的来说,图书馆电子资源的文献类型呈现愈来愈丰富、加工深度愈来愈深的趋势。早期图书馆电子资源以各类目录数据库为主,这里的目录数据库不仅包括各馆基于机读目录格式所建立的各类书目数据库和专题目录库,也包括相关资源供应商提供的专题目录库,如SCI、EI等索引数据库建立的时间比图书馆的目录数据库还要早。

随着时间推移,为了让用户更加准确地了解资源是否真的能为自己所用,只依靠题目信息已经不够,一些电子资源数据库在原来图书或期刊目录的基础上增加了相关文摘,老牌的文摘、索引提供商也开始逐渐实现其产品的数字化,有些资源提供商为了回避资源全文的版权问题也建立了诸多的文摘数据库,相当多的文摘数据库如今仍旧是相关研究人员非常喜欢使用的资源。20世纪80年代,国外很多数据库都开始提供全文,资源类型主要涉及期刊和图书,这些期刊和图书绝大部分是由原来的纸质资源数字化而来,也有一些原生的电子期刊和电子图书。随后,电子学位论文、电子报纸、电子数据、音视频资源、专利、标准、科技报告等也逐渐成为商业数据库提供商的内容资源。国内提供全文的商业数据库,诸如清华同方、重庆维普、万方等公司的电子期刊数据库,超星公司的电子图书数据库的建设和提供服务都到了20世纪90年代中后期,这些数据库重点对已有纸质资源进行回溯性数字化,并开始与出版机构合作,从源头上获取电子出版的资源,持续更新到数据库中。世纪之交,方正阿帕比、书生等公司开始与相关出版机构合作,推出在版新书的电子图书数据库,中经网、国研网等公司则开始基于各类统计数据提供数据查询服务,会议论文、电子报纸、法律条文、音视频学习资源、标准、古籍文献、地方志、词典词条、百科知识、人物传记、图片素材、教学案例、软件工具等陆续被纳入电子资源数据库,图书馆电子资源几乎涵盖了图书馆用户服务实践中所涉及的各类文献,揭示的深度也从原来目录、文摘、全文到目前细化的知识点,用户可以查询的字段也从原来的题名、作者、来源、时间、引文等基于文献本身的项目,发展到现在很多电子资源数据库支持的查询定义、图表、数据等知识内容方面的项目。

20世纪90年代末在国际学术界、出版界、信息传播界和图书情报界大规模兴起的开放获取运动,在2002年2月《布达佩斯宣言》正式发布之后取得了更加长足的发展,截至2018年10月,开放获取期刊的数量已经增至12195种[11],机构知识库登记的已有4693个。[12]图书馆在购买商业电子资源的同时,也在整理开放获取的期刊和第三方机构库的资源,将其纳入本馆对外提供服务的电子资源中,诸如Primo之类的电子资源发现系统提供商在其中央知识库也大量纳入开放获取的资源。图书馆电子资源也已由原来的纯商业电子资源演变为目前的商业资源和开放获取资源相混合的局面,且将在相当长的时间内存在。这在丰富图书馆电子资源内容的同时,也增加了图书馆电子资源管理的难度。