2.2 国内外信息架构研究现状及发展趋势
2.2.1 信息架构的涵义
“架构”一词最早源于建筑学领域。1964年,在IBM的一篇研究报告中指出,架构被定义为概念结构、功能行为、明确组织内数据流和控制流、逻辑设计和物理实施[11]。不容争议的是此时所提出的架构是将其扩展应用到了计算机系统领域,更加偏向于计算机硬件系统设计中。而真正将信息与架构二词结合起来的是美国建筑师Richard Saul Wurman于1975年以书本为实践对象首先提出的[12]。从1980年代开始,学者们逐渐将信息架构与信息系统联系起来,开始关注复杂且动态的信息环境的设计。这一阶段的信息架构倾向于作为计算机基础设施、数据层次的设计与创建工具[13]。Earl[14]于1989年采用架构来形容IT框架,并将其分为四个领域:计算、通信、数据与应用。此段时间,相对于学术界而言,产业界在此领域的探索更显活跃。而后随着Web 2.0的发展,网络资源日益膨胀,信息架构开始应用到网络信息资源管理及万维网设计[15]等领域。图2.1中为初期信息架构的提出、发展过程及对应代表人物的简易图。
图2.1 信息架构初期发展[15]
无论上述哪种意义的信息架构,虽然都已经提出并发展了很多年,但直到目前仍没有形成统一的定义。信息架构的定义,仍是信息系统领域值得深入研究的课题。James C. Wetherbe认为信息架构是企业内使用的,与用户、组织、技术独立信息分类的轮廓说明(Profile)[16]。但目前更多学者们认为信息架构是对组织内信息需求的高层“地图”,或者为了实现组织的目标而对组织内各类信息进行组织和处理的过程[9][16]。基于上述定义,信息架构的设计应该从高层概念视图开始,并细化到技术最底层,以指导物理数据库的设计与实施。根据所应用领域的不同,其含义也应该有所不同[17]。通过对现有各个领域信息架构定义的分析,可总结出以下几个方面的考虑:
(1)架构、技术与视角应具有相对独立性[18]。架构应该具有相对的灵活性,定义的组件应该具有可重用性。视角不仅包含技术方面,同时也应包含组织结构及商业战略等多方面。视角作为不同利益相关者之间沟通的渠道,应该具有不同的粒度且可以平缓转换。
(2)信息实体描述疑问词:对信息的抽取一般从六个疑问词(5W1H)入手进行描述,包括是什么(数据内容)、如何(过程/情境)、在哪儿(网络地址)、谁(利益相关者)、什么时间,以及为什么(动机)[19][20]。
(3)用户友好性信息导航:指对信息的组织、标签和导航机制的设计,进而使用户可以轻易地获取到所需信息,加快完成任务的效率[15][21][22]。
(4)活动的文档模板:对业务过程中每个活动所需信息定义的文档模板[23][24]。
(5)信息管理:从企业架构的角度促进组织内信息的存储、组织和获取[19][25][26]。
(6)变革管理:表明商务战略、技术变革、文化、态度或行为的变化对企业所带来的影响[27-30]。
(7)情境感知:在架构设计过程中将信息作为构建情境的“原材料”[31][32]。
(8)业务驱动:无论是企业、组织还是技术角度思考架构,信息架构都应该是作为业务与IT之间有效的桥梁,即将组织高层战略映射到技术环境中[33][34]。
当然,信息架构与搜索引擎、交互设计等相关,但却有着本质的区别。搜索引擎面对的是信息寻找这一过程,但信息维度的多样性,以及人和信息的关系,是纯粹的搜索引擎不能解决的问题。交互设计面对的是人和系统间的交流,而本书所研究的信息架构却是梳理信息系统本身。信息架构是在交互设计基础上,解决用户对于信息的理解并帮助用户如何便捷地找到所需要的信息或者某个内容,并设计用户获取信息的整个工作路径。因此,实践信息架构设计模式将涉及到三个方面的有机融合,即用户、信息和情境[15],进而实现对业务的支持作用。
2.2.2 不同视角的信息架构研究现状
通过对文献的大量调研与分析,本书中认为目前对于信息架构的研究主要集中在以下几个不同视角。
1. Web设计研究视角
互联网信息大规模地膨胀,使得信息架构刚一提出就在此领域得到了广泛应用。根据前文对信息架构与建筑学领域之间渊源的描述,在此领域,信息架构的设计除了在造型方面极大程度上借鉴了建筑学思想,非常重视信息展示的结构与美观外,信息架构的研究主要集中在四大核心方面:组织系统、导航系统、标识系统、搜索系统[15][35]。其中,组织系统解决信息资源的分类和如何组织的问题,确定整个信息系统的内容框架。导航系统解决的是内容框架的显示方式问题,以方便使用者的浏览。标识系统解决的是内容体系的命名问题,并形成统一的标准方案。搜索系统解决的是用户快速查询所需信息的问题,它提供了一系列可能比较模糊但相对全面的搜索结果供用户挑选。这个角度最有代表性的学者有Rosenfeld, Morvile等。
在以上四个系统的设计过程中,国内学者们致力于将生态学和认知心理学的基本观念引入到信息架构的设计方法中。周妍[36]将生态观点引入到互联网信息环境中,提出了信息生态系统中三要素(信息、信息人、信息环境),并以此指导互联网信息生态环境的规划。在传统网站的设计中,目前主要的研究已经触及到了公益网站[35]、电子商务网站[37],希望通过信息内容的规划来促进与用户的沟通效果。近年来,随着智能移动终端的发展,基于用户终端信息需求、搜索行为和信息模型的基础上,探索适合手机应用程序的信息架构设计方法[38]也成为一个研究热点。
概括起来,此角度认为信息架构是研究信息环境设计、组织和管理的学科,旨在帮助用户在复杂网络环境中快速方便地发现与管理信息。
2.企业架构研究视角
企业架构是涵盖企业战略、业务、组织、IT各个层面的全方位的规划。它是建设企业信息化的蓝图;是适应企业业务变革的方向盘;是沟通业务与信息技术间的桥梁;也是实现业务、信息、应用和技术之间协同的枢纽。目前业界相对认可的企业架构有Zachman框架、开放组织体系结构框架TOGAF、EAP [39]、DoDAF [40]、联邦企业体系结构框架FEA [41]等。这些架构之间的联系及转化过程如图2.2所示。
图2.2 企业架构发展过程
针对本书中的研究内容,我们选取其中比较有代表性且包含信息角度的架构讨论如下。
(1)Zachman框架结构。
企业架构领域开拓者Zachman于1987年提出了Zachman框架雏形,之后又于1992年在原有对数据结构、功能结构和网络结构描述的基础上,又增加了对人员的组织、开发进度计划,以及实施战略的描述。Zachman框架最终表现为一个六行六列的矩阵模型(图2.3所示)。
其中横向的六行从上到下由宏观到微观,从不同的视角来描述系统,它们从上到下分别是:从规划者的视角来看系统的范围,它定义了组织的方向、目的和边界,包括组织外部的驱动因素和需求,以及组织的业务功能模型等;从所有者的角度来看业务模型,用术语定义了组织本质,包括结构模型和过程模型;从设计者的角度看系统模型,将业务模型提高到一个更细致的程度上,包括系统的需求定义和系统逻辑模型;从实现者的角度来看技术模型,它定义了如何通过技术来满足其他各行所定义的需求,包括解决方案的定义和开发模型,以及实现的物理模型;从集成和部署者的角度来看的构建和部署模型,它定义了系统的详细设计过程中用来选择的工具和方法;从用户角度来看功能模型,即组织内各层次的功能。
Zachman框架中的纵向六列抽象了组织中构成对问题空间完整描述的各种元素,主要包括:数据(What)指组织中的重要对象、实体和组件及它们之间的关系;功能(How)指如何实现活动间的有效组合;地点(Where)强调活动的地理分布,即执行部门所在;人员(Who)界定了参与组织各层次活动的人员及其责任;时间(When)描述了活动执行的优先顺序;目标(Why)指业务目标、战略措施的具体实现形式。
Zachman框架的主要贡献在于:它把企业架构的结构清楚地划分为明确定义的视图。在某种程度上,它为信息架构的研究提供了描述和分析架构结构的方法,也为本书进行信息架构进行视图划分提供了启发。同时,它提出的5W1H一方面有利于对于信息资源的组织,另外也促进对于信息利用情境的设计。但是,它并没有提供各个视图之间的转换方法,缺乏确保视图一致性的方法,不利于架构的变更及匹配管理。
(2)TOGAF框架结构。
开放组织体系结构框架(The Open Group Architecture Framework, TOGAF)是用于支持部分受到商业体系结构影响的关键任务应用的软件基础结构设计。它主要关注四个子体系结构:业务体系结构、应用程序体系结构、数据体系结构和技术体系结构[25],如图2.4所示。其中应用程序体系结构和数据体系又被称为信息系统体系结构。业务体系结构定义了业务策略、管理权、组织结构和关键业务流程。应用程序体系结构提供了各个应用系统的蓝本,与组织核心业务过程的关系和交互。数据体系结构描述了组织逻辑和物理数据的结构。技术体系结构描述了支持关键应用开发的核心软件体系结构。
图2.4 TOGAF框架内容
体系结构开发方法(Architecture Development Method, ADM)是TOGAF的核心[42]。ADM提供了开发满足业务需求的IT企业结构的方法,是正确地解释如何从基础体系结构获取到具体组织的体系结构,其中所包含的阶段如图2.5所示。
此外,还有一些其他企业在架构研究中也定义了信息层面的内容。集成架构框架(Integrated architecture framework, IAF)是Capgemini公司提出的企业架构框架。此框架中包含四个领域,即业务、信息、信息系统、技术设施;四个抽象层次,即情境层次(目的)、概念层次(内容)、逻辑层次(过程)和物理层次(数据);安全与治理方案[43][44]。Archimate机构通过从自然语言中提取出主谓宾三个元素来实现业务、应用及技术三个层面的架构设计[26]。还有在国内以甘仞初教授为代表的实验室团队提出了需求驱动的自适应体系结构(Requirement-Driven Adaptive Architecture, RDAA)[45][46],由用户需求层、领域服务层、业务流程层、功能层和数据层等层次构成。
图2.5 ADM循环开发路径
具体到医疗卫生行业中,比较值得学习和借鉴的有加拿大全国电子健康档案蓝图[47]、美国国立卫生研究院NIH体系结构框架[48]和美国卫生和公众服务部HHS企业体系结构[49]。加拿大全国电子健康档案蓝图,可以说是世界上最为完善的国家级电子健康档案的顶层指导纲领,旨在通过规范健康档案的管理来建成以病人为中心的全国性卫生业务网络。虽然它强调了以数据为中心的指导系统建设的方法,但是在实施过程中还是通过数据登记、接口和接入等技术方法来解决这一问题的。
NIH框架将医疗组织环境化为业务、信息和技术三层体系结构。其中,业务体系结构是信息体系结构为之服务的一组医疗组织基本需求,代表了组织的核心使命和业务实践,而信息体系结构则通过建立一系列模型,说明了业务流程与信息系统的关键要素(含信息、使用信息实现业务流程的应用,以及信息与应用间的集成)之间的映射关系。HHS企业框架是基于联邦企业架构(FEA)的,在业务范围层、数据层、应用层和技术层等基础上又集成了战略层、预算层、人力资源层和设施层等,通过这八层架构中的模型以及多个视图,为整个美国医疗卫生和公务服务部的多个利益相关者提供信息通用框架,保证各部门内部的信息共享。
3.业务流程研究视角
虽然说信息领域可以与业务流程领域分开,但是他们之间确实存在着极大的关联性。因此,有些学者从业务流程的视角研究信息架构的建立。业务流程重组与信息架构拥有共同的战略和业务流程关注点[24]。信息架构通过对信息资源的获取及序列化来改善现有业务流程[50],为流程中每个活动提供相应的信息支撑。而反过来,业务流程中也包含了信息[51],通过对业务流程中活动所需信息进行识别分析,建立信息/流程矩阵[52],既可以建立信息的静态视图和动态生命循环图,同时也可以用来获取信息模式。
业务流程的研究目前已有很多成熟的工具和建模语言,如BPMN [53]等,因此,从业务流程中去提取信息实体就有了技术支撑。Yousef [54][55]通过建立BPAOnt本体提出了BPAOntoSOA框架体系,来建立基于语义知识的企业业务流程架构,这个本体可以抓取企业流程的架构元素。而最为重要的是后来这个本体被很多学者用来实现业务架构与信息架构之间的转化。如Mahmood [56]采用Riva方法及BPAOnt提取了企业的信息架构。
具体到应用领域,以医疗及供应链管理领域最为突出。医疗领域中主要体现在对临床路径及临床决策等方面。Unertl等学者通过半结构化的面谈及直接观察方式,在三个不同的慢性病诊所中进行了流程模型与信息模型的研究[57],为今后慢性病的治疗提供情境化的信息工具。Staccini等采用从上到下的方式将流程分解为较小粒度的活动,并用ICOM模型(输入—控制—输出—机制)[58]来规范化并识别相应的信息项,进而组织目标、情境、用户、应用平台与系统集成起来。Amitava等人在定义临床决策模型时也强调了通过业务流程来识别决策中所需要的各类临床及非临床信息[59]。
将信息架构应用到供应链的质量管理、生产制造管理等领域,也是从流程角度对信息架构的研究热点之一。Xu [60]指出了面向服务的架构、RFID、智能体、工作流管理以及Internet of Things等信息架构相关实现方法在连接生产者、消费者及企业之间的物流中所发挥的作用,但却没有形成系统的架构体系来支撑供应链的整个过程。Marquardt [61]强调了在生产与设计过程中所需相关信息的重要性,并设计了信息模型来辅助协同设计。
4.图书情报研究视角
上文中所提及的三个角度的研究更多地源于国外,而国内对信息架构的研究,多体现在传统图书资料管理及情报学领域。IA被引入国内图书情报界后,又被译为信息建筑学、信息构建、信息空间构筑等。目前,周晓英教授提出的“信息构建”[62]的译名在国内学术界得到较多的认同。此领域的研究内容主要集中于:IA基本理论研究[63]、对情报学的促进、与知识管理的关联、在数字图书馆的应用[64]等方面。一般而言,这一研究视角中主要关注的是信息理解、可用性及可追溯性,更加侧重对信息组织方式的研究。如曹锦丹博士[65]提出了根据实际的应用场景而形成“个性化”的、动态的新型信息组织模式,建立了信息资源本体与用户问题域融合的信息组织机制与资源构建模式,从而满足多方面用户需求。此外,从信息构建向知识构建[66]的递进和发展也成为一种研究趋势。这一部分内容与本书的研究视角稍有出入,因此,在这里并不做过多讨论。
2.2.3 信息架构研究述评及发展趋势分析
通过前文中对于从不同视角出发的信息架构的讨论分析,可以将信息内容、情境以及用户三个方面凝练为开展数字化医院信息架构研究所必须综合考虑的关键要素。企业架构视角的研究,启发了本书信息架构对于不同视图、维度等的抽取,且在一定程度上丰富了本书中所论述的架构的组件设计。但是通过对前人研究文献的分析,目前对于信息架构的研究中仍存在以下问题。
(1)架构设计中组织战略、业务需求与IT战略融合性不高。
现有的信息建模方法大多从系统论、控制论和软件工程理论角度出发,建模方法相对机械和僵化,强调对数据存储和处理,如结构化方法中面向数据的(Jackson的结构化程序设计)、数据流分析及数据元的规范化,关注底层的数据建模(E-R图)、关注对信息资源的创建与使用(C-U矩阵)、面向行为地以功能和操作为中心来构造系统(数据流图),且将企业组织看作一个机械系统,忽视了组织中人的主观能动性和潜在组织环境的影响,因此不能准确刻画客观世界的动态性、复杂性和社会性。面对这种问题,我们应该考虑的是:如何基于组织视角,提出一种架构设计方法,能够实现从企业环境、业务流程及技术三个层次满足信息架构(as is)与实际组织系统(to be)的同构和良性转化?
(2)作为企业架构的一个视角,现有信息架构的研究过于宽泛,并没有提出具体的实现方法。
区别于从软件应用系统角度研究的信息架构,从组织管理角度来研究信息系统体系结构的方法(如Zachman、FEAF、DoDAF和TOGAF),能够从多视角、多层面考虑组织需要的信息,顾及到各利益相关者的意愿与要求,这均为本书对于信息架构的研究提供了理论支撑。但是,对这类体系结构的研究,往往缺乏对建模与实施过程中理论与方法上的具体指导,很难从信息架构的组成原理与运行机制上保证各层面间功能和语义上的完善映射,而用户需求、业务、信息与技术基础设施之间的对接恰恰是架构研究中最为关注的方面。因此,如何抽象并定义相对松散的信息架构“组件”,通过研究其中的关键技术,定义其中的动态机制,是保证信息架构真正发挥作用所必须要解决的问题。
(3)现有信息架构并未强调信息价值的最终实现,对复杂多变的信息需求应对能力相对较弱。
信息最大的特征之一在于其具有极强的灵活性。现有医疗环境中大部分的信息需求是难以预测的,相对固定和僵硬的信息架构无法满足复杂多变的信息需求。因此,相对稳定但却具有一定自适应能力的信息架构则能更加快速地对信息需求作为反应。因此,如何在对利益相关者的信息需求分析的过程中提出全局性的需求建模方式?是否可探索将频繁出现的需求提取为需求模式的方法,加速信息的获取过程?如何实现信息架构中用户需求、信息服务与信息资源之间的有效映射?
(4)我国数字化医疗领域中对于信息架构理论和应用研究的相对缺失。
数字化医疗的建设相对于电子政务、企业组织等来说,起步本身就相对较晚。而我国在进行数字化医疗的探索建设过程又一直是以模仿加拿大、美国等发达国家进行的。信息架构是一个与组织文化相关的存在形式,不同的国家体制与国情必然带来医院组织文化的差异,这也就导致HHS、NIH等架构体系并不能直接适用我国数字化医院的信息规划。我国大部分医疗组织均因为医疗本身业务的极度复杂性及信息系统渐进式建设产生的历史性原因,对组织内高层信息需求规划的呼声异常强烈。然而通过对目前文献的调研来看,还未形成适应于我国数字化医院的信息架构设计方法和成功应用实例。