第二节 构建数据库和图像预处理
一、专用数据库及测量软件系统研发
东北大学软件研究院为本项目组编制专用数据库以及管理和测量软件系统,命名为脑医学图像数据库(medical image database of brain,MIDOB),用于存储数据和保存测量结果,其架构见图2-1,系统设计见图2-2。
图2-1 脑图像数据库MIDOB系统架构
图2-2 MIDOB系统设计
该数据库及工作站的主要功能包括:存储海量数据、对数据库中数据进行人口统计学信息、临床信息和图像特征信息检索、图像数据的导入和导出。该系统能对检索到的图像数据进行后处理,例如进行二维和三维测量、分析和可视化处理等。数据库及检索系统与图像处理软件系统实现接口,图像处理专业软件能进行DICOM与其他图像格式的自由转换,虚拟内镜和局部透视处理,功能模块的提取与分析,信号强度规范化处理,能手动和全自动实施图像分割、配准和融合,图像三维重组、最大或最小信号强度投影(maximum or minimum intensity projection,MIP)、多平面重组(multiplane recombination,MPR)和曲面重组(curved planar reformation,CPR),实现图像的信号强度反转、边缘增强、纹理提取,以及其他处理功能(图2-3、图2-4)。
图2-3 图像处理界面
图2-4 图像处理示例
显示单侧侧脑室(黄色部分)
二、MRI图像质量控制及预处理
(一)图像质量控制
由于个体脑MRI图像的质量会影响脑图谱的质量,因此必须进行有效的数据质量控制。
本志愿者数据集来自全国不同区域(如南、北方)的汉族人群。数据由15家医院采集,志愿者来自全国24个省和直辖市,共计3 000例。尽管所用扫描仪的扫描参数固定,但仍有许多因素会影响图像质量,为此,进行了较为严格的质量控制。
首先,由有经验的研究人员检查数据完整性,并主观评估图像质量。若发现图像质量差,则当即予以剔除。尽管如此,最终构建脑模板时,还有840例由于信息缺失或图像质量问题而被弃用。
其次,采用自动噪音估计方法(Liu等,2012)定量评估图像质量,通过设置噪音水平来筛除噪音过多的个体图像。构建脑模板时,还有140例因信号噪音水平过高而被删除。
本研究共搜集3 000例正常志愿者组成数据库,而最终仅2 020例被试数据用于构建脑模板,其中1 081例来自西门子设备(女性559人,平均年龄44.3岁,18~76岁);939例来自GE设备(女性515人,平均年龄42.4岁,18~74岁)。
(二)数据预处理
经过图像质量控制的数据主要以DICOM格式存储。创建脑图谱之前,MRI图像通常经过一系列的预处理操作,步骤包括格式转换、去偏场、方向调整及去颅骨等。
1.使用 MRIConvert(https://lcni.uoregon.edu/downloads/mriconvert)软件将DICOM格式转换为Analyze格式(包括img文件及头文件)。
2.采用N4ITK软件对所采集的脑MRI图像进行偏差场校正(Tustison等,2010)。
3.重新定位脑MRI图像到AC-PC位置(图2-5),并通过医学图像处理、分析和可视化软件(Medical Image Processing,Analysis and Visualization,MIPAV,NIH,USA)进一步对齐相同的大脑位置。
4.采用英国牛津大学用于功能磁共振成像、核磁共振成像和DTI脑成像数据的综合分析工具库FSL软件包(FMRIB Analysis Group,Oxford,UK)中的 BET2进行颅骨去除。保留小脑以保持脑的完整性。第3和第4两步预处理使得所采集的中国人脑MRI图像位于坐标空间的中心且头颅方向为正。
图2-5 AC-PC的位置示意图
红色箭头指AC,绿色箭头指PC,蓝色线为AC-PC位置
5.进行灰度归一化,以校正因不同医院不同采集设备所致的信号强度分布差异。归一化处理具有较高的分辨率和信噪比,是因为其是基于脑模板Colin-27(Holmes等,1998)进行的。采用直方图匹配方法将每个被试的直方图归一化到Colin-27的直方图之上。
另外,与后续采用弹性配准的层次属性匹配机制(Hierarchical Attribute Matching Mechanism for Elastic Registration,HAMMER,https://www.med.unc.edu/bric/ideagroup/free-softwares/fast-hammer/)(Shen 等,2002)的配准方案相对应,进一步进行以下预处理:在完成上述第4步处理后,采用FSL软件包的FAST算法进行组织分割,获得脑灰质(gray matter,GM)、白质(white matter,WM)和脑脊液(cerebrospinal fluid,CSF)的分割图像。采用MIPAV,基于HAMMER给不同的组织分配特定的值,例如WM =250,GM = 150,ventricles(VN)= 50,CSF = 10。
(梁佩鹏 李坤成)