数据驱动的图书馆学情报学——2019年图书馆学情报学热点鸟瞰
2019年对于中国的图书馆学情报学而言,有不少研究热点和创新趋势,但最显著、最重要,并对整个图书馆学情报学产生重大推动力的无疑是数据驱动,主要表现在这一学术研究点的热度持续升高,这一学术主题的研究更为聚焦、更为深化、更为拓展,这一学术主题的影响力也更为扩大、更为跨界、更为国际化。我们可以通过数据驱动、数据主导、数据计算、数据服务、数据素养等五个方面来予以具体观察。
一、数据驱动
进入21世纪第二个十年以来,大数据持续成为学术界所关注的热点,特别是2017年至2019年,中共中央政治局就大数据、人工智能、区块链先后举行了三次集体学习,不仅为经济社会发展的数据驱动提供了战略指引,也为数据驱动的图书馆学情报学提供了创新指引。2017年12月,中共中央政治局就实施国家大数据战略进行了集体学习,习近平在主持学习时强调,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,实施国家大数据战略,加快建设数字中国。[1]2018年10月,中共中央政治局就人工智能发展现状和趋势举行集体学习,习近平主持学习时强调,在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术的驱动下,人工智能加速发展,人工智能是引领这一轮科技革命和产业变革的战略性技术,具有带动性很强的“头雁”效应,加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。[2]2019年10月,中共中央政治局就区块链技术发展现状和趋势进行集体学习,习近平在主持学习时强调,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用,我们要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发展。[3]显然,新一代科技革命和产业变革正在引领新时代经济的高质量发展,也正在催生以数据驱动为主要特征的图书馆学情报学的研究新主题、新方法和新形态。与此同时,英国学者迈尔-舍恩伯格、库克耶等所著《大数据时代》等有关大数据的一批研究成果的问世,助推了数据驱动的学术热潮。2018年,“大数据视域下数字人文研究”列入由中国人民大学、《学术月刊》和《光明日报》联合推出的“2018年度中国十大学术热点”。点评专家王晓光教授在入选理由中认为:“2018年,伴随数字中国理念的兴起和哈佛大学中国历代人物传记资料库(CBDB)的示范效应,数字人文研究进一步受到中国人文学界的关注,包括历史学、文学、语言学、图书情报学、艺术学等多个学科的学者都加大了数字人文研究力度,催生了众多领域导向性专题数据库建设与探索性研究项目,这些项目是当代技术条件下的‘典籍编撰’活动,也是人文研究在未来数字空间中延续繁荣的基础。”[4]在数据驱动持续升温的发展进程中,2019年的图书馆学情报学更是显现出数据作为发展基点的重要驱动力的年度学术发展特征。
据中国人民大学复印报刊资料《图书馆学情报学》编辑部提供的数据,在该刊2019年全年12期中,共全文转载了200篇图情学科的相关论文,其中62篇是关于数据主题和数据方法研究的,占31%。从这些论文刊载的期刊分析,图书情报学界的专业学术期刊几乎不约而同地形成了群体聚焦,几乎所有期刊都围绕数据主题发表了不同研究维度的学术论文,其中部分论文具有开创性并提出了研究新命题。《中国图书馆学报》作为最具学科影响力的学术期刊,在这一主题的研究中起到了引领作用,刊发了多篇以数据研究为主题的论文,如王芳的《数据科学视角下数据溯源研究与实践进展》、胡小菁的《文献编目:从数字化到数据化》,还有刘炜的《5G与智慧图书馆建设》等。另外有丁遒劲和曾建勋的《文献元数据集成管理研究》(《情报学报》)、曹树金的《大数据驱动的图书馆精准服务研究》(《大学图书馆学报》)、杨九龙等的《人工智能在图书馆应用的理论逻辑、现实困境与路径展望》(《图书情报工作》)、陈传夫的《完善政府数据开放主体制度的路径研究》(《情报科学》)、黄如花等的《图书馆参与政府数据开放运动的驱动因素、实践发展与启示》(《情报资料工作》)、吴丹的《基于可穿戴设备的医疗健康数据生命周期管理与服务研究》(《信息资源管理学报》)、聂磊和王继民的《从数据科学视角看情报学与数据的关系》(《图书情报知识》)、周耀的《区块链技术在智慧图书馆中的应用研究》(《现代情报》)、葛燕君的《图书馆数据开放的内涵、价值、实施与隐私保护》(《情报杂志》)、丁波涛的《政府数据治理面临的挑战与对策》(《情报理论与实践》)、张连分的《大学图书馆开展数据管理服务的实践和成效评析》(《图书馆建设》)、王世伟的《关于人工智能与图书馆服务重塑的五个问题》(《图书与情报》)、顾立平和包秦雯的《国外开放科研数据的激励政策》(《图书馆论坛》)、李卓卓的《面向效能评估的英美公共图书馆数据采集及启示》(《国家图书馆学刊》)、彭程程和吴斌的《“智慧校园”学者画像系统研究》(《数字图书馆论坛》)、焦海霞的《由信息素养馆员向数据素养馆员转型:动因、模式与路径》(《图书馆学研究》)等。2019年创刊的《文献与数据学报》也发表了初景利和张颖的《以信息和数据为核心构建图情档学科体系与能力》,以上这些学者群体与刊物群体的高度聚焦与关注,充分体现出2019年图情学术研究中的数据驱动特征。不仅如此,这些论文围绕数据驱动主题所研讨并涉及的数据开放、数据管理、数据控制、数据质量、数据溯源、数据挖掘、数据大脑、数据共享、精准服务、数据伦理、数据规范、数据计算、数据关联、数据引用、数据保存、数据安全、科学数据、数据仓储、数据战略、数据馆员、数据可携权、数据生命周期、从数字化到数据化、人工智能和5G通讯与图书馆重塑等诸多内容,既有对以往学术研究的进一步深化,也有许多新的学术亮点和学术研究新命题,对于面向未来的图书馆学情报学研究而言,具有重要的开新和启迪作用。
二、数据引导
国家社科基金重大项目在一定程度上体现出学术研究的前沿性、战略性、发展性和交叉性,也在一定程度上折射出学术研究的发展趋势和学术研究一定时期内的重点。2019年,有10位图情界学者在新中标的国家社科基金重大项目中担任了首席专家,他们所主持的重大课题中以数据研究和数据方法为主题内容的有8位,占80%。如陈传夫主持的“社会数字化转型背景下图书馆发展风险规制研究”,吴丹主持的“面向三大公共数字文化工程资源融合的多语言信息组织与检索研究”、夏立新和叶继元分别主持的“新时代我国文献信息资源保障体系重构研究”、杨海平主持的“南海疆文献资料整理中的知识发现与维权证据链建构研究”、邱均平和唐晓波分别主持的“基于大数据的科教评价信息云平台构建和智能服务研究”等,[5]这些图情学界的领军人物的课题设计、内容选择与研究路径,无疑在图情学科中起到了学术研究导向的作用,让图情学界对未来数据驱动的图书馆学情报学有更多的期待和热望。
在2019年,图情的高校院系和图情学术组织也分别举办了许多颇具学术影响力的以数据为主题的学术研讨会,在图情学界吹起了阵阵数据引导的学术春风。
2019年8月,主题为“新时代图书馆的转型发展:均衡 融合 智慧”的中国图书馆年会在内蒙古鄂尔多斯市东胜区隆重召开,年会中所举办的“开放科学与机器智能环境下学术信息服务范式变革”分会场、“智慧·融合·跨越——智慧图书馆阅读服务创新”分会场、“信息素养与可持续发展”主题论坛等都秉持数据驱动的创新理念,围绕服务范式、服务创新和可持续发展等不同内容进行了理论与实践紧密结合的研讨。在“开放科学与机器智能环境下学术信息服务范式变革”分会场,中国科学院《全球变化数据学报(中英文)》编辑部主任刘闯做了《科学数据新型服务的战略取向与创新举措》的研究报告,一针见血地指出现阶段我国的科学数据面临产能高、共享率极低,高质量学术论文及关联科学数据外流的困境与短板,直抒胸臆地提出了我国需要把国家公共财政资助产生的数字化科技资源的掌控权留在中国科技界的决策建言。中国科学院计算机网络信息中心大数据部数据工程实验室主任李成赞则做了《云环境下数据出版探索与实践》的研究报告,为图情学界提供了中国科学院计算机网络信息中心围绕数据出版模式最新探索与实践的相关信息,如云环境下数据出版框架与平台建设、数据有效传播机制、数据影响力评价等。[6] 2019年8月,由上海图书馆学会、中国图书馆学会数字图书馆专业委员会、上海图书馆(上海科学技术情报研究所)主办的“AI在图情——2019图书馆前沿技术论坛”举行,这是基于人工智能飞速发展的浪潮和图情领域正在兴起的智慧图书馆、智慧情报、科技智库、数字人文等应用热潮的学术活动,孙坦、张智雄、刘炜、王鑫、祝忠明、章成志、阮光册、王军、欧石燕、赵宇翔等多位在数据研究领域活跃的专家学者分别围绕认知计算、语义网络、深度学习、神经网络、本体应用、区块链、知识图谱、开放计算、自动标引、关联数据、数字人文、众包等数据智能前沿的诸多主题内容进行了深入探讨,并从问题导向和现实导向出发,针对人工智能将如何颠覆图书情报行业、智慧数据及应用、下一代系统与数字人文等业界关注并疑惑的命题有针对性地展开了交流和互动。这些研讨无疑对图情学界同样起到学术研究内容的数据引导作用,也为图情学界的学术研究带来了一片新天地。[7]
武汉大学大数据研究院作为图书馆学情报学在数据驱动方面的学术重镇,于2019年11月主办了“2019珞珈大数据论坛”,论坛的多场主旨报告中,无论是李建成的《数字改变世界》还是曾大军的《混合智能及其在复杂场景预测中的应用》,无论是樊文飞的《社交媒体的营销分析》还是张俊的《金融大数据平台建设实践》,均体现了图书馆学情报学界在数据驱动研究中的跨界、前沿、应用的学术特点,论坛上还有大数据研究院和来自武汉数文科技有限公司、阿里乡村事业部实验室的技术专家分享交流了最新的研究成果。论坛所显示出的数据驱动的学术气场给业界内外的学者和同学留下了深刻的印象。显然,“珞珈大数据论坛”不仅成了以问题导向和数据驱动为特点的跨界学术交流大平台,也成了培养数据科学复合型人才的学习大平台。[8]
此外,如由国际信息系统协会中国分会于2019年10月主办的主题为“智能社会中的信息系统创新”的信息系统协会中国分会第八届全国大会,由北京大学信息管理系于2019年11月主办的主题为“图书馆变革与发展:效能、智能、赋能”的全国图书馆学博士生学术论坛,由上海图书馆学会上海图书馆(上海科学技术情报研究所)、松江区人民政府、华东政法大学于2019年12月主办的主题为“数据之巅——多源多维度数据研究的眺望”的上海市图书馆2019学术年会的青年学者论坛,由吉林大学管理学院于2019年12月举办的主题为“数据生态与智慧服务”的青年学者论坛暨学科建设研讨会,这些论坛的研讨内容大都围绕数据驱动而展开,持续不断地为图书馆学情报学研究注入了数据驱动的动力与活力。
三、数据计算
在数据驱动和数据引导下,数据计算成了图情学术研究中更为普遍的方法。2019年11月在天津南开大学召开的中国社会科学情报学会2019年学术年会上,有许多学者围绕数据计算进行了主旨演讲。如王晓光的《从文献资源到智慧数据:语义增强的方法与路径》、黄水清的《新时代人民日报分词语料:语料库构建与性能测评》等,这些演讲的视域和方法无疑给图书馆学情报学的研究提供了新方法和新路径的诸多启迪。
在数据计算方面,中国图情界首次以数据统计为主题的国际学术研讨活动具有创新性和国际性。2019年11月,国家图书馆研究院、中国图书馆学会城市图书馆工作委员会等机构在广州图书馆联合举办了“提升效能、创新发展与图书馆统计”学术研讨会,体现了深度的前沿理论引领和创新性的实践探索的有机结合。曾经担任国际图书馆协会和机构联合会主席的克劳迪娅·卢克斯在研讨会上做了题为“国际图联《图书馆统计宣言》的解读”的演讲,为人们带来了数据计算的更为广阔的国际视野,她从国际图联的《图书馆统计宣言》出发,阐释了图书馆统计数据及统计工作的重要意义,并从数据搜集、数据统计、数据评估等方面展开,希望图书馆界能越来越重视统计数据,用数据为图书馆发声,这些观点为数据计算的图书馆学情报学理论如何与图书馆实践相结合,提供了具有可操作性的重要路线图。同时,研讨会也揭示了目前中国图书馆界在图书馆统计方面存在的统计口径不一致、填报数据质量参差不齐等短板,为推进图书馆统计制度更加完善、更加定型,为进一步提高图书馆在数据统计方面的治理体系和治理能力,提供了理论与实际相结合的准备。[9]
在数据计算方面特别值得一提的是,2019年9月,华东师范大学与科睿唯安公司进行战略合作的科研项目开始启动,此项目以华东师范大学信息学系赵星教授领衔的学术团队为主角,旨在以数据计算、分析和提炼为方法,向学术界展示中国哲学社会科学研究国际化进展、前沿、热点与话语权。尽管这一以数据计算为主要研究方法的重大学术项目成果尚在进行之中,但可以预期的是,这一跨界合作的重大项目以文化自信和国际化的胸怀,以时不我待和数据驱动同频共振的机遇意识,将成为图书馆学情报学界运用计算方法的重大全新成果,实现图书馆学情报学理论研究方法与实践目标紧密结合的穿越和超越。
四、数据服务
在数据驱动的学术大背景下,图情重要机构于2019年也推出了基于数据管理的学术服务,并对未来的数据服务进行了研讨和规划。
联合在线发布古籍数字资源成为2019年图情学界实现跨界学术影响力的重要服务举措。2019年11月,国家图书馆(国家古籍保护中心)与吉林省图书馆、山东省图书馆、宁波天一阁博物馆、广东省社科院图书馆、内江师范学院图书馆、河南省唐河县图书馆等20家单位,联合在线发布古籍数字资源7200余部(件),使全国在线发布的免费古籍资源超过7.2万部(件)。[10]如此巨量的历史文献进行跨时空的在线服务,没有协调整合的数据管理平台是难以想象的。
开放数据应用开发竞赛成为2019年图情学界实现跨界学术影响力的又一重要服务举措。上海图书馆开放数据应用开发竞赛由国家文化和旅游公共服务研究上海图书馆基地与上海图书馆(上海科学技术情报研究所)主办,这一赛事自2016年至2019年已举办4届,2019年的赛事自2019年4月至9月延续了半年之久,并进一步扩大合作范围,与6家数据合作机构共同打开数据宝库,面向国内外征集以开放数据为基础的优秀移动应用产品原型或服务创意,以期更加充分地释放开放数据的价值,最大程度地挖掘其背后的应用潜力。这一数据服务的赛事持续升温,相对于2018年竞赛,2019年的竞赛报名团队数量和参赛人数分别增长了40.9%和35.5%,还吸引了多名来自中外合办和境外高校的学生和研究人员参赛,如上海纽约大学、美国佛罗里达大学、美国北得克萨斯大学、德国波恩大学、美国得克萨斯A&M大学、英国华威大学和美国加州大学戴维斯分校等,使这一图情界的数据服务赛事更具国际影响力。[11]
未来的数据服务如何规划和深化成为2019年图情界管理者和研究者思考的重要命题。全国数字图书馆建设与服务联席会议制度于2007年7月建立,取得了一系列重要成果。2019年12月,全国数字图书馆建设与服务联席会议第二十次会议在北京召开,主题为“图书馆转型发展与未来规划”。会上,汪东波的《新时代国家图书馆转型发展的实践与思考》、刘炜的《第三代图书馆系统与数字图书馆未来发展》、赵艳的《国家科技知识服务体系发展思考》、罗云川的《公共数字文化融合背景下公共图书馆创新服务的探索实践》的报告,围绕数据驱动的图书馆服务进行了交流。会议明确了数据驱动的图书馆服务转型发展方向与“十四五”规划思路,讨论并通过了《数字图书馆资源管理指南》,对加强和规范图书馆数据资源管理具有重要的指导意义。[12]
五、数据素养
图情学界多年关注的信息素养命题在2019年更为聚焦,并呈现出信息素养向数据素养聚焦的发展趋势。
“信息素养与可持续发展”主题论坛成为年度信息素养研究的重要学术活动,由武汉大学信息管理学院、中国图书馆学会学术研究委员会、澳门大学图书馆、《图书馆杂志》社于2019年8月联合主办。这一论坛聚焦图书馆行业发展信息素养教育的议题,并与联合国教科文组织“全民信息计划”(Information For All Program)的优先领域相联系。来自中国大陆(内地)、台湾和澳门的6位专家,围绕如何提升信息素养教育的质量,如何提升公民的信息素养水平,信息素养教育如何推动联合国2030可持续发展目标的实现等问题,进行了精彩的主旨演讲。如张久珍的《数据素养教育的设计与实施》,指出了数据素养教育将成为信息素养教育的重要内容和发展方向;彭慰的《大学本科生的信息素养教育——台湾经验分享》则总结了中国台湾地区不同的大学在开展本科生信息素养教育时的一致目标,即培养大学生成为批判性思考、独立学习与终身学习者;黄如花的《信息素养教育对可持续发展目标的贡献》,阐述了如何通过信息素养教育促进可持续发展目标的实现;林佳的《新媒体时代的信息素养教育——清华大学实践案例》,强调每一位社会公民需要较传统媒体时代具备更好的信息素养,以适应新媒体时代的信息环境;吴丹的《近十年国外信息素养理论研究》,从理论研究的角度梳理了近十年国外图书情报学领域信息素养研究的进展,并提出了未来研究的趋势;耿琳琳的《翻转教学法在信息素养讲座中的应用:以澳门大学图书馆为例》,以澳门大学图书馆为案例,探讨了“雨课堂”工具的应用场景,强调对信息素养教育发挥的作用。在主题论坛上,中国图书馆学会秘书长霍瑞娟介绍了由中国图书馆学会和武汉大学信息管理学院等单位共同发起的《中国公民信息素养教育提升行动倡议》,倡议提出了四项主要内容:面向国家信息化战略需求,构建中国公民信息素养培养体系;面向国家教育创新战略需求,推动优质信息素养教育资源建设与共享;面向国际信息素养教育新环境,建立中国信息素养教育论坛;面向国家文化走出去战略需求,传播信息素养教育的中国声音,并号召全国各级各类图书馆和有关机构积极响应倡议和联合开展行动。[13]
在中国图书馆学术年会的基础上,中国图书馆学会和武汉大学信息管理学院于2019年11月又联合主办了“首届图书馆对公众开展信息素养教育研讨班”。研讨班向学员介绍了当前信息环境下联合国2030可持续发展议程和联合国教科文组织“全民信息计划”的有关内容,指出国际图联和中国科协等有关方面对信息素养教育的高度重视,为学员阐述了我国图书馆对公众开展信息素养教育的重要意义。研讨班上,霍瑞娟的开幕致辞、黄如花的《我国图书馆对公众开展信息素养教育探索》和《国际公众信息素养教育的发展与动态》、潘卫的《我国公众信息素养教育现状与策略》、林佳的《信息环境对公众信息素养教育的影响》、冯玲的《公共图书馆与信息素养教育》等报告以及图书馆的现场教学,为学员们带来了理论与实践相结合的丰富的数据素养学习内容。[14]
2019年数据驱动的图书馆学情报学,如同高山大川,远望可见其势,近察可见其质。2019年的图情学术界的数据热点,不仅在图情学术圈形成了热点,而且这种学术温度也影响感染了其他学科,如2019年国家社科基金各个学科的重大项目中,采用数据搜集、数据挖掘、数据计算、数据分析方法的项目,已占到相当高的比例。数据服务已让整个学术界受益,而数字人文的发展,也促进了中国社会科学情报学会数字人文专业委员会与敦煌研究院在敦煌文化方面采用数据方法的协同创新,并于2019年7月主办了敦煌文化遗产数字化国际研讨会。数据驱动的图书馆学情报学将进一步释放本学科的学术创造活力,以点石成金的智慧激活国情学界的巨大发展潜能。可以预见的是,数据驱动将在未来若干年内继续成为图书馆学情报学的研究热点和推动力。需要指出的是,在数据驱动带来普遍学术红利的同时,我们也应该以批判的眼光和反思的精神对这一学术热点进行思考,即我们需要在泥沙俱下的复杂多样的数据中进行鉴别研判并去伪存真,在与日俱增的表层物象数据中通过人的智慧发现深层互联的真相,在浩如烟海、习以为常的数据浪潮中发现价值的亮点,在数据驱动的大背景下始终秉持学术的道德、价值、伦理和智慧。武汉大学大数据研究院院长马费成教授在“2019珞珈大数据论坛”致辞中表示,“武汉大学大数据研究院的目标是基于人工智能技术、大数据技术和其他现代信息技术,构建当代人文社会科学研究的数字平台,为人文社会科学研究带来新的研究范式,以期建成我国人文社科研究的大数据高地,其宗旨是服务武汉大学人文社会科学研究,辐射全国,走向世界”。[8]这正是对2019年数据驱动的图书馆学情报学的当下洞察和未来愿景的诠释。
参考文献
[1]习近平:实施国家大数据战略加快建设数字中国[EB/OL].[2019-12-10].http://www.xinhuanet.com//politics/2017-12/09/c_1122084706.htm.
[2]加强领导做好规划明确任务夯实基础 推动我国新一代人工智能健康发展[EB/OL]. [2019-12-10].http://paper.people.com.cn/rmrb/html/2018-11/01/nw.D110000renmrb_20181101_1-01.htm.
[3]把区块链作为核心技术自主创新重要突破口 加快推动区块链技术和产业创新发展[EB/OL].[2019-10-26].http://203.192.15.131/content/20191026/Page01DK.htm.
[4]中国十大学术热点研究课题组.中国学术热点趋势报告(2018—2019)[M].上海:上海人民出版社,2019.
[5]2019年度国家社科基金重大项目立项名单公布[EB/OL].[2019-12-17].http://www.npopss-cn.gov.cn/n1/2019/1204/c219469-31490279.html.
[6]2019年中国图书馆年会“开放科学与机器智能环境下学术信息服务范式变革”分会场(北京)在中科院文献情报中心召开[EB/OL].[2019-12-11].http://www.lsc.org.cn/contents/1432/13892.html.
[7]AI在图情——2019图书馆前沿技术论坛(IT4L2019)[EB/OL].[2019-12-13]. http://society.library.sh.cn/it4l19.
[8]司湘云,王丹丹,刘政昊.2019珞珈大数据论坛隆重举行[EB/OL].[2019-12-15]. http://bdi.whu.edu.cn/news_show.aspx?id=921.
[9]“提升效能、创新发展与图书馆统计”学术研讨会在广州图书馆成功举办[EB/OL]. [2019-12-15].http://www.lsc.org.cn/contents/1351/14722.html.
[10]杜羽.7.2万部古籍数字资源可免费阅览[N].光明日报,2019-11-13(11).
[11]上海图书馆2019开放数据应用开发竞赛奖项揭晓 为您呈现历史建筑与开放创新的完美盛宴[EB/OL].[2019-12-13].http://beta.library.sh.cn/SHLibrary/newsinfo.aspx?id=780.
[12]全国数字图书馆建设与服务联席会议第二十次会议在北京召开[EB/OL].[2019-12-11].http://www.lsc.org.cn/contents/1186/14744.htm.
[13]“信息素养与可持续发展”主题论坛[EB/OL].[2019-12-11].http://www.lsc.org.cn/contents/1432/13962.html.
[14]首届图书馆对公众开展信息素养教育研讨班在海口举办[EB/OL].[2019-12-11]. http://www.lsc.org.cn/contents/1214/14715.html.
(写于2019年12月18日)