第一节 医疗卫生信息分类与编码综述
一、卫生信息分类与编码的概念
(一)卫生信息的分类
1.卫生信息
卫生信息,从广义上讲可以认为是与医药卫生有关的任何形态的信息,它是反映卫生系统的活动特征及其发展变化的各种消息、情报、数据和资料的总称。传统的卫生信息是建立在机构统计的基础上,基本数据来自卫生系统的常规报表;现代卫生信息则是以整个人群为基础,反映人们生育、生长及生活中与卫生服务相关的一系列相关信息。
2.卫生信息分类
卫生信息分类是基于对卫生信息的规划、发展、应用和管理需求,探讨卫生领域数据信息的科学分类和标识方法,将具有共同特征的数据归并在一起,使之与不具有上述共性的数据区分开来,并通过设定的编码规则进行唯一识别,以支持在领域层面对数据信息进行统筹规划、系统描述、关联分析和应用设计,促进公共卫生信息的系统性规划、规范化管理、一致性表达,进而促进信息的有效交换和广泛共享[1]。
(二)信息编码
信息编码是将事物或概念(编码对象)赋予具有一定规则、易于计算机和人工识别处理的符号,形成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。所有类型的信息都能够进行编码。对信息编码后,信息就能被不同用户组或应用系统共享。信息编码的主要作用是标识、分类、参照。其中标识的目的是把编码对象彼此区分开,在编码对象的集合范围内,编码对象的代码值是其唯一性标志;分类的作用实质上是对分类进行标识;参照的作用体现在编码对象的代码值可作为不同应用系统或应用领域之间发生关联的关键字。
(三)卫生信息数据及其分类
1.数据元(data element)
数据元是数据的基本单元,其定义、标识、表示和允许值可通过一套属性来定义。在特定的语义环境中,通常用于构建一个语义正确、独立且无歧义的特定概念的信息单元,被认为是不可再分的数据单元。数据元一般来说由对象类、特性和表示三部分组成。类的属性取值以数据元的形式表现。
信息的分析利用依赖于对数据元准确、一致的理解。为了正确理解和应用数据元,需要对每个数据元进行全面的描述和解释,并在一定范围内达成一致,即形成数据标准。
2.数据集(data set)
数据集是具有主题的、可标识的、能被计算机处理的数据集合。每个数据集所具有的属性都包括通用属性和特有属性两部分。数据集的通用属性包括数据集主题、标识、实体和数据项,又称“基本属性”。数据集特有属性包括类别、区域、专业、学科、建立时间、涉及的疾病等。
卫生信息数据集是在医药卫生领域,为满足政府卫生决策、业务处理、科学研究、信息发布与绩效评价等需求,按照数据集概念设计、归纳、整合的主题信息集合[2]。医药卫生领域的数据集主要可以归纳为三种类型。
(1)信息发布类统计数据集:
如《中国卫生统计年鉴》中卫生机构设置及规模、卫生人员资源的地区分布、卫生经费的筹集及分配等数据集,各类卫生机构的统计月报、年报,以及满足某一专项统计需求通过统计收集、归纳、整理、报告形成的数据集。
(2)业务系统建设类的基本数据集:
包括医疗、公共卫生、卫生监督等领域为了满足业务信息系统规范化建设和领域内部及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合,如儿童出生登记、食品卫生许可、个人健康档案、住院患者入初转、居民死亡登记报告等基本数据集。
(3)为满足特定目的收集、整理制作的数据集:
包括通过调查、观察、检测、检测、试验、实验等方式获取的满足科学研究、业务咨询或卫生服务决策等需求的数据集。如近年来国家投入建设的医药卫生科学数据共享数据集、卫生服务调查数据集、疾病及危险因素调查等内容的数据集。
3.卫生信息共享文档(health information sharing docament)
不同医疗机构、卫生服务机构、不同应用系统中的医疗卫生信息之间的互通共享,可以帮助提高医疗保健质量、降低成本以及减少医疗差错,进一步提升卫生管理与决策水平。具有业务逻辑特征和明确语义的卫生信息共享文档规范的制定及实施是以实现互联互通、信息共享为目的的卫生信息化建设的关键,是卫生信息化工程的支撑和重要组成部分,关系到整个卫生信息化建设的可持续发展。
作为卫生信息的一部分,专门规定临床文档内容的标准化,提供一个能够表达所有可能文档的通用架构,是目前临床文档应用中最为广泛采用的标准,得到了许多医疗卫生信息技术标准的开发和促进组织的支持。
借鉴采用国外成熟的通用架构,并在满足中国卫生信息共享实际需求前提下,以数据元和数据集来规范约束卫生信息共享文档中的数据元素,以模板库约束为手段来规范性描述卫生信息共享文档的具体业务内容,以值域代码为标准来规范性记载卫生信息共享文档的编码型数据元素,从而清晰展示了具体应用文档的业务语境以及数据单元之间的相互关系,支持更高层次的语义上的互联互通。
二、卫生信息分类与编码的原理
(一)信息分类
1.信息分类原则
医院信息化建设离不开信息系统的应用,而医院信息系统的推广应首先制定信息分类与代码标准。在编制信息分类与代码时应遵循以下原则。
(1)科学性原则:
网络环境下的医院信息系统均采用分布式数据采集方式,故在编制信息分类时应将信息(数据)发生源认为是一种稳定的分类属性作为节点。如医院中信息发生于门诊、住院或辅诊,则可将这些作为节点划分为大的分类,并以此为基础细分到信息的最终发生源。
(2)系统性原则:
在整个医院信息分类中,既要强调整体性,又要充分考虑内部各组成之间的相互独立性。一般认为医院中信息发生的主线为患者,因此在保证信息分类的整体性时应以患者信息为主线贯穿整个分类体系。同时应尽量使分类体系简化,保证各分系统的独立,去掉冗余信息,优化分类体系的结构。
(3)实用性原则:
实用性强的分类体系有利于设计、建立数据完整的医院信息数据库与医院信息系统。一般数据库管理系统以及针对数据库操作的应用程序都可以对数据库中数据的完整性进行约束,但这种约束是程序级的控制,仅停留在形式上,而从本质上保证数据的完整性要靠科学的信息分类和在此基础上设计的信息数据库。
2.信息分类原理
按信息分类原则,信息分类方法采用线分类法,即将分类对象按选定的若干属性(信息发生地),逐次地分为若干层级,每个层级又分为若干类目。同一分支的同层级类目之间构成并列关系,不同层级类目之间构成隶属关系。如门诊号,其上一层为门诊就诊,再上一层为门诊管理。相应的代码类型采用数字型,即01-门诊管理,02-门诊就诊,001-序号,门诊号这个词条的最终代码为0102001,见表6-1。
表6-1 医疗信息分类与代码体系表
3.疾病分期
是一种表达疾病严重程度的专家系统,目前已经分级的疾病有420多种,每种病分为4个阶段,表示疾病的严重程度由轻到重,预后也越来越差。做法是首先选择能包含大多数出院病例的大约400种常见病种,然后由专家组依据基本诊断、患者性别、年龄、入院情况、出院情况、伴随病等对每种疾病按照严重程度分为4级,最后由病案管理专家将临床专家的严重度分级翻译成相对应的ICD-10编码。由此形成的计算机软件可以从出院汇总数据中自动读取患者的主、次要诊断,并结合手术操作、性别及出院时是否死亡等记录,将患者分入420种疾病中的一类,并确定疾病分期等级。
4.疾病严重度分类系统
该系统与急性生理与慢性健康评分(APACHE)类似,根据患者的原始数据,如年龄、性别、主要诊断及主要的临床检查、检验结果做严重度评价,评分计算与诊断无关。APACHE主要用于重症监护(ICU)患者死亡危险的评价,而MedisGroups则试图将危险评分扩展至所有患者。
5.病种病例分型
该方法是我国学者提出的病情评价方法,它将住院病例按病情轻重分为A、B、C、D四型,分别表示单纯普通病例、单纯急症病例、复杂疑难病例和危重病例4个严重度水平。方法是以住院患者为观察单位,经过专家评判与多元统计分析方法相结合筛选指标后,用逐步判别分析方法建立病种病例分型的判别函数方程,经过反复修改,最后由计算机模拟系统给每个病例一个严重度分型。严重度分型与诊断、治疗无关。该评价方法已被用于病例质量费用的综合评价[3]。
(二)设计编码
为医疗卫生信息基本数据分类代码体系设计两类代码系统,一类是主分类代码系统,一类是复分类代码系统。分类框架中的所有类目按主分类代码规则进行编码,基本数据按主分类代码加复分类代码进行编码。
1.主分类代码体系
分类框架中每个类目设定唯一的主分类代码,代码为7位混合码,码位结构设计如表6-2所示,其中主题域为1位英文字母,从A、B、C、D……开始,主类、子类、小类各为2位数字,从01到99,类层级间按从属关系逐级顺序编码。
表6-2 码位结构设计
2.复分类代码体系
本分类体系最终是对主题数据进行分类和标引,而每一个小类下都会有若干相同主分类编码的主题数据,因此仅通过主分类编码不能对数据进行唯一标识,需要对其进行进一步细分。如图6-1所示,为了增强类层级相同,但学科、地区、专业等内容不同的主题数据的标引与检索能力,并缩小分类表的篇幅和细分需求,还可以进一步设立复分类表。
复分类表主要是从基本数据主题概念、学科、地域等综合因素考虑,采用分段编码设计,其基本内容由地区、组织机构、国际疾病分类和学科分类代码四段30位代码组成,格式为××××××—×××××××××—××××××—×××××××,如图6-1所示;其中,第1段6个数字表示地区码(国标),第2段9个数字表示组织机构码(国标),第3段7位表示疾病编码(ICD-10),第4段8个数字表示学科分类码(国标)。当体现某个复分表分类属性时,整段编码用0标识。
图6-1 复分类表编码表