上QQ阅读APP看书，第一时间看更新

第2章　医学影像基础

第1节　医学影像数据格式

一、DICOM标准简介

随着计算机应用水平的不断提高和医院信息化进程的推进，医学诊断设备中最重要的一个分支——医学影像设备也得到了快速发展。在现代医院信息源中来自于影像归档和通信系统（picture archiving and communication systems，PACS）、放射信息系统（radiology information system，RIS）的影像信息占到医院总信息量的80%以上。

医学影像（CT、MRI、PET等）具有成像机制复杂、数据结构多样、数据量大等特点。由于医疗设备生产厂商的不同，造成与各种设备有关的医学影像存储格式、传输方式千差万别，使得医学影像及其相关信息在不同系统、不同应用之间的交换受到严重阻碍。因此，为了推动与厂家无关的开放式医疗数字影像的传输与交换，促使PACS系统的发展与各种医院信息系统的结合，DICOM便应运而生。

建立DICOM通用标准的目的是为了允许所产生的诊断资料库能广泛地经由不同地方的设备来访问。这个标准是由美国放射协会（American College of Radiology，ACR）和全美电子厂商联合会（National Electrical Manufacturers Association，NEMA）联合推出的医学数字图像存储与通信标准，它从最初的1.0版本（ACR-NEMA Standards Publications No.300-1985）到1988年推出的2.0版本（ACR-NEMA Standards Publications No.300-1988），再到1993年发布的DICOM标准3.0，已逐渐发展成为医学影像信息学领域的国际通用标准。

DICOM标准的支持能够更有效地在医学影像设备之间传输交换数字影像，这些设备不仅包括CT、MR、核医学和超声检查，还包括CR、胶片数字化系统、视频采集系统和医院信息系统（hospital information system，HIS）/RIS信息管理系统等。按照DICOM标准格式存储的医学文件就是DICOM文件，它们是医学影像设备产生并包含某个病人信息数据及医学影像数据的综合，通常后缀为DCM。本节中主要讲述这种标准的影像数据格式，以及DCM格式文件的基础内容。

二、DICOM标准的关键概念

DICOM是一个数字医学影像的网络通信接口标准。将现实世界中的实体进行抽象数据化是制定标准的一个重要步骤，它所定义的信息模型具有非常典型的面向对象特征，这使得这个标准可以很容易地进行扩展并保持向前兼容。下面介绍DICOM标准中的相关关键概念。

（一）信息对象定义

DICOM标准描述了许多信息对象类（information object class，IOC）。这些类是对现实世界中医疗实体的面向对象抽象的定义，这个定义被称为信息对象定义（information object definition，IOD）。每个信息对象定义由若干包含相关信息的信息实体（information entity，EI）组成。每一个信息实体对应着DICOM应用模型中的现实世界实体（如患者、影像等）的一个数据抽象。每个信息实体是由一至多个模块（module）组成，每个模块又包括大量的相关属性（attributes），属性就是现实世界中实体某个性质的抽象（如患者的编号、姓名、性别、影像的成像日期等），每个属性在实际的数据存储和传输中被编码为固定格式的数据元素（data element）来描述，而一个信息实体的相关属性的集合则组成了数据集。结构参看图2-1。

图2-1　DICOM信息对象结构图

（二）服务对象类

面向对象的设计思想不仅体现在对象本身的抽象，也体现在怎样处理这些对象的方法。DICOM标准利用面向对象抽象方法定义了诸如存储影像、获取病人信息等多种服务，被称为服务类。一个服务类由若干个相关的服务对象类（service object pair class，SOP类）组成。对于一个特定的SOP类来说，一台装置会处于服务类提供者（service class provider，SCP）或者服务类使用者（service class user，SCU）两种角色，SCP角色提供SOP类的服务，相当于客户/服务器模型中的服务器；SCU角色的装置使用SOP类的服务，它相当于客户/服务器模型中的客户。例如，一台成像设备要在影像工作站计算机存储一幅DICOM影像，此时成像设备是与影像接收和存储相关的SOP类的SCU，即使用者，工作站为SCP，提供影像接收和存储服务。一个SOP类的一次具体实现称为服务对象实例，存储影像、获取病人信息等操作都是通过SOP实例实现的。

（三）DICOM数据元素的结构

通过上文信息对象的介绍可知，实体对象类的每个具体属性在实际的数据存储和传输中被编码为固定格式的数据元素以达到交换DICOM信息的目的，具体到每一个DICOM文件，数据元素就是指在该设备所产生影像文件中细化到病人的姓名、设备的类型、检查的时间等信息。要了解DICOM文件的格式，就必须了解数据元素的格式和内容。数据元素的基本结构由标签（tag）、数据描述（value repre sentation，VR）、数据长度（value length）及数据域（value field）四部分组成，如表2-1所列。

表2-1　数据元素基本结构

标签是无符号整数，分为组号和元素号，表示为形如（gggg，eeee）十六进制组，其中组号表明数据元素所属的组，元素号表示同一组中不同的数据元素。标签可以唯一表示一个特定的数据元素，通过检索标签实现数据元素的检索。

数据类型规定了数据元素的数据类型和格式，如果数据元素的定义中忽略了数据类型字段则是隐式传输（implicit VR），存在数据类型字段则是显式传输（explicit VR）。显式传输中VR为OB、OW、SQ时占4字节（数据结构类型参考DICOM标准3.0），其余都为2字节。

数据长度指明数据元素的数据域中数据的长度（字节数），一般为两个字节，但当隐式VR和VR为OB、OW、SQ类型时，用4个字节表示。

数据域存放了该数据元素的数值，该字段的数据类型由数据元素的VR所确定。

（四）DICOM文件格式

DICOM文件通常由文件头（DICOM file meta information）和数据元素集组成。

DICOM文件头是顺次包括128字节的文件序言（preamble）、4字节的DICOM前缀（prefix）。文件序言是可以存放文件的有关说明，它不像DICOM数据元素那样有标签和值长度字段，所有的字节为00H。前缀包含了固定字符串“DICM”，一般用这4字节判别一个文件是否是一个DICOM文档，如图2-2所示。

图2-2　DICOM文件格式结构图

文件头之后是存储的影像数据，也就是由数据元素组成的数据集（其中可以包括其他嵌套的数据集），在读写时应遵循DICOM数据集的相关定义。

（五）DICOM文件的特点

与传统胶片方式对比，基于DICOM标准采集到的影像的主要特点如下：

1．DICOM影像除了有影像大小、高度、宽度、每像素字节数等普通影像的必备信息外，还在数据集合的数据元素中存储了大量医疗信息，如病人姓名和年龄、医院名称、设备类型、成像时间、检查部位等。

2．DICOM影像能自由调节窗宽、窗位，充分利用设备采集到的丰富信息帮助诊断。

3．目前CR影像的空间分辨率达到了6.0LP/cm，像素矩阵至少要求2048×2500，这就要求作为取代胶片成为诊断影像载体的显示器必须具有非常高的分辨率，并且作为一个影像工作站的显示器数目以2~4台为宜。CT影像分辨率一般是512×512的，好一点的普通显示器就能满足诊断标准了，如SONY E230等。而CR、DR的分辨率一般是2048×2500，用2k×2.5k的竖窗显示器才能满足诊断要求。

4．医学影像的数据量大，CT影像一般为0.5MB，CR影像一般为8MB，DR影像一般为16MB，数字化乳腺影像可达到40MB，1例DSA的资料可达GB数量级，并且还有多种新的成像设备在不断投入使用，所示，医学影像的数据量还在急剧上升，医院每天可产生达到几个GB的数据，所以必须有大容量存储器才能支持。

第2章 医学影像基础

第1节 医学影像数据格式