第1章 绪论
1.1 研究背景和现实需求
1.1.1 研究背景
随着信息化技术日新月异的发展,以及对数据的生产、存储、处理等能力的进一步提高,传统的互联网技术正由原来的计算科学转换为数据科学,在大数据、“互联网+”和“工业4.0”迅速发展的浪潮中,谁拥有数据谁就拥有了开启未来大门的钥匙。信息化时代人们获取信息的来源主要是互联网,如何从浩如烟海的互联网数据中提取有价值的信息成为目前的研究热点,为此知识图谱技术应运而生。
知识图谱理论是由C. Hoede和F. N. Stokman最先提出的,也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,通过知识图谱可以揭示概念之间的关系,以图的方式展示知识。知识图谱是一个可以将“搜索引擎”进化为“知识引擎”的革命性技术。
包装工业是与国计民生密切相关的服务型制造业,在国民经济与社会发展中具有举足轻重的地位。经过30多年的建设发展,我国包装工业已建成涵盖设计、生产、检测、流通、回收循环利用等产品全生命周期的较为完善的体系。“十二五”期间,包装工业规模稳步扩大,结构日趋优化,实力不断增强,地位持续跃升,在服务国家战略、适应民生需求、建设制造强国、推动经济发展中的贡献能力显著提升,我国作为世界第二包装大国的地位进一步巩固。目前,包装工业已位列我国38个主要工业门类的第14位,成为中国制造体系的重要组成部分。包装工业作为服务型制造业,是国民经济与社会发展的重要支撑。随着我国制造业规模的不断扩大和创新体系的日益完善,包装工业在服务国家战略、适应民生需求、建设制造强国、推动经济发展等方面,将发挥越来越重要的作用和影响。
“十三五”时期是我国全面建成小康社会的决胜阶段,也是包装工业发展的重要战略机遇期,为加快包装产业转型升级,推进现代包装强国建设进程,充分发挥包装工业对稳增长、促改革、调结构、惠民生、防风险的重要作用,显著提升包装工业对我国小康社会建设的服务能力与贡献水平,《中国包装工业“十三五”发展规划》中明确要求,按照“五位一体”总体布局和“四个全面”战略布局要求,牢固树立“创新、协调、绿色、开放、共享”的发展理念,立足服务型制造业特征,以提高发展质量和效益为中心,以转型发展为先导,以科技创新为动力,着力推进供给侧结构性改革,有效转变生产方式,优化供给结构,化解过剩产能,培育增长动力。重点发展绿色包装、安全包装、智能包装,大力倡导适度包装,深入推进军民通用包装,全力构建资源节约、环境友好、循环利用、持续发展的新型产业格局,有效夯实产业发展基础。实施“创新驱动战略”,深度对接消费品工业“三品”专项行动,不断增强自主创新能力,显著提高两化融合水平,着力加强包装品牌培育,大力促进新型业态成长。通过转型升级和提质增效,增强全产业链在市场需求结构变化中的供给能力,提升在“中国制造”体系中的支撑力和在国民经济建设中的贡献力,促进产业保持中高速增长,迈向中高端水平,逐步实现我国由“包装大国”向“包装强国”的转变。
“中国包装大数据知识图谱”面向需求进行构建,涵盖包装工业和包装学科两大部分,通过对包装分类标准进行科学定义,确定其属性及功能,利用可视化的图谱形象来展示产业和学科的核心结构、发展历史、前沿科技以及整体知识架构从而达到企业和学科融合,它把复杂的包装知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,从不同角度分析不同概念及其之间关系,揭示产业和学科之间的隐形规律,适应现代社会发展强大的大数据及其存储、计算平台、移动互联网的趋势,使包装工业大数据的大爆发通过快速的电子数字化、人工智能检索的手段,服务于最大范围的受众成为可能。
1.1.2 研究意义
“中国包装大数据知识图谱”作为一个大数据共享交换平台,首先可以做到清晰行业大数据及大数据信息分析,使各包装企业实时了解最新政策并做好前瞻性的顶层规划;同时具有城市级大数据支撑并可以转发企业大数据管理,使各包装企业实时了解行业间(跨时间、地域)发展最新动态并做好相应的企业转变及规划;最后进行包装行业数据的共享、交换、公开,使各包装企业以数据驱动创新,以服务驱动创业,借助大数据共享平台降低开发门槛。
“中国包装大数据知识图谱”体现了文理交融,多学科交叉的特点,将包装工程、计算机应用技术、图书情报分析、逻辑学、统计学等多个学科知识进行有机整合,增强了各学科融合发展能力,激发了创新活力。
“中国包装大数据知识图谱”是大数据与人工智能的融合,两者的结合将释放出巨大的能量。目前的包装数据搜索领域只有静态的包装企业数据,而“中国包装大数据知识图谱”则是一个与人工智能相结合的时刻变动的数据库。用户可以根据需要通过一定的关键词找到想要的信息。有时候用户语言可能是模棱两可的,如一个搜索请求可能代表多重含义,但大数据库通过人工智能的处理之后,会将信息全面展现出来,让用户找到自己最想要的那种含义,提供最全面的摘要。大数据库知识图谱可以更好地理解用户搜索的信息,并总结出与搜索话题相关的内容。例如,当用户搜索“瓦楞纸板”时,不仅可看到瓦楞纸板的材料信息,还能获得关于其企业发展背景和相关技术发展方面的详细介绍,让搜索更有深度和广度。由于大数据库构建了一个与搜索结果相关的完整的包装知识体系,所以用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。
从微观层面来讲,“中国包装大数据知识图谱”的构建和应用可以使包装中小企业及高校实时了解包装行业最新行情和市场趋向,从而提高企业的创新力和竞争力,促使企业特色发展;各个高校可以实时了解企业所需人才技术从而明确人才培养和科研方向,从而提升高校服务国家经济社会发展需要的水平;中国包装大数据知识图谱在构建过程中始终强调探索包装的本质、内在规律和功能,这种探索能够为包装工业在国民经济中的特殊地位正名,甚至为包装成为一个学科提供理论和数据的支持。
从宏观上讲,“中国包装大数据知识图谱”的构建将填补国家包装行业大数据领域的空白,可以使政府部门实时了解和分析包装行业的规模和动态,从而提高政府和行业管理部门的决策、管理、监督和服务能力;“中国包装大数据知识图谱”的构建将促进整个包装行业适应国家“五位一体”发展战略的整体发展,大数据库的建立可以加快行业和产业的转型升级,使包装产业逐步向绿色、集约、创新方向发展;同时可以加快包装行业整合,通过企业联合、收购、兼并等多种手段,形成一些大型企业、联合企业,从而推动包装行业向前健康发展,加快我国包装工业从世界包装大国向世界包装强国转变。