-
脑肿瘤是指发生于颅腔内的神经系统肿瘤,又称颅内肿瘤,其主要发生于成年人,特别是老年人,具有复发率高、病死率高以及治愈率低3大特点[1]。脑肿瘤产生的常见危害是造成脑内组织水肿和压迫中枢神经等脑内正常组织。脑肿瘤伴随的脑水肿会导致颅内压升高,在临床上脑肿瘤患者多表现为头痛、呕吐或瞳孔病变等。脑肿瘤的生长会直接压迫正常脑内功能结构,诱发认知能力下降、偏瘫、失语症、反应迟钝等局部神经症状的发生。
脑部磁共振成像(magnetic resonance images, MR)是脑肿瘤疾病检查的主要手段之一,具有实时成像、无创伤性成像、无辐射性成像、成像分辨率高等优点。MR利用原子核自旋运动的特点,成像设备对脑组织进行外加磁场干预,并用探测器检测射频脉冲激发脑内原子后所产生的信号,再由计算机对探测器检测的信号处理成图像[2]。脑肿瘤疾病诊断普遍使用的MR是结构性磁共振影像(structural magnetic resonance imaging, sMRI),sMRI能够定性地展现大脑中肿瘤组织和正常组织的位置、形状和大小,为医生把握患者的病情提供有效参考。sMRI在成像过程中可以通过调节参数生成T1、T2、T1ce(T1增强)、Flair(液体衰减反转恢复)等多种序列,以不同方式呈现组织特性,为临床诊断提供多角度、多方位的准确信息。如,肿瘤和纤维组织在T1序列中均多呈低信号,而在T2序列中肿瘤多呈现为高信号,纤维组织呈现低信号。这样,就可以通过T1、T2序列的结合来对目标组织进行判断。通常脑肿瘤在多序列MR中呈现出的肿瘤区域由3个子区域组成,分别为水肿区域(edema tumor, ED)、增强区域(GD-enhancing tumor, ET)、非坏死区域(necrotic and non-enhancing tumor, NCR)。
基于MR的脑肿瘤患者存活周期预测研究,能够为临床诊断效果的判别和医师相关治疗计划的调整提供相应的辅助参考信息。因此,基于MR的脑肿瘤患者存活周期预测在临床中也极具意义。但是,基于MR的脑肿瘤患者存活周期分析是一项极具挑战的工作,因为临床中保留下的可供分析的完备且有效的样本数量相对较少,增加了分析难度。随着机器学习等人工智能技术的不断成熟,基于MR的脑肿瘤患者存活周期预测的研究也取得了一些进展。文献[3]提出了一种基于图像特征和非图像特征的线性回归模型的分析方法,其从脑肿瘤MR的Groundtruth中提取了ED、ET以及NCR部分的体素数目和表面积等6种图像特征以及患者的年龄和手术状态2种非图像特征,最后将8种特征输入到线性回归(linear regression, LR)[4]模型中进行学习训练以进行存活周期分析。文献[5]提出了一种基于纹理特征和多层感知机(multi-layer perception, MLP)[6]模型的分析方法,其通过计算肿瘤MR的一阶统计、形状特征、灰度共生矩阵和灰度运行长度矩阵特征,并从ED、肿瘤核区域(tumor core, TC)及ET区域中提取了468个特征,并将提取的468种特征输入到MLP中学习训练,经过相关模型调优后完成脑肿瘤患者存活周期分析的工作。文献[7]提出了一种基于脑肿瘤患者年龄和LR的分析方法,其直接将患者年龄输入到LR模型中训练以进行存活周期分析。以上3种方法在Brats2018 Challenge[8]的脑肿瘤患者存活周期分析赛道中取得了前3名的成绩。除了以上方法外,相关的机器学习回归方法,如支持向量机模型(support vector machine, SVM)[9]、K近邻(K-nearest neighbor,KNN)[10]、随机森林(random forest, RF)[11]等模型,也在此领域中有着相关应用。
虽然脑肿瘤患者存活周期分析领域已经取得了一些进展,但是仍存在一些问题待解决。首先,一些方法在前期特征工程阶段存在特征提取针对性不强和特征选择缺失的问题。现行系统中的许多方法在特征提取阶段针对性不强,没有根据分析目的进行特征提取。并且相关方法没有对所提特征集进行去冗余和去相关处理,在特征提取阶段提取的原始特征集中可能存在大量的冗余特征和相关特征。如果直接利用原始特征集进行模型的训练不仅增大模型的训练代价而且可能会限制模型泛化能力的提升。其次,分析模型选择目的性不明确。由于临床中可用的训练样本较少,所以在进行分析时就应该尽可能地选取泛化能力高的分析模型。虽然MLP、LR等模型具有简单、可操作性高等优点,但是通过优化目标的分析可以了解到这些模型的泛化能力与基于MR的脑肿瘤患者存活周期分析的要求还相距较远。为解决以上问题,本文提出了一种基于Adaboost的脑肿瘤患者存活周期分析系统。
HTML
-
Brats2018 数据集是一个开源的多序列的脑肿瘤MR数据集,由训练数据(train data)、验证数据(validation data)、测试数据(test data)3个部分组成。其中,只有训练部分公开了相关样本的存活情况,所以本文使用Brats2018的训练数据进行相关实验验证。Brats2018的训练数据包括210个高级别受试MR和75个低级别受试MR。每例受试MR中分别包含T1、T2、T1ce、Flair 4个序列的sMRI和肿瘤区域标注Groundtruth。在肿瘤区域标注Groundtruth中,Brats2018对脑肿瘤的ED、ET和NCR的不同区域用不同标签进行了标记。除此之外,Brats2018训练数据集还提供了163例高级别受试MR对应的生存周期、年龄、手术情况信息。本文利用Brats2018训练数据中拥有存活周期信息的160例受试MR进行训练和验证。图3为Brats2018训练数据集中某一受试样本的T1、T2、T1ce、Flair及分割Groundtruth像。其中图3a为T1序列;图3b为T2序列;图3c为T1ce序列;图3d为Flair序列;图3e为Groundtruth;图3f为Brats2018训练数据的存活周期分布直方图。
-
表1为通过以MI为评价准则对原始特征集进行特征选择之后得到的特征子集,其中包括14个T1序列的纹理特征,11个T2序列的纹理特征,13个Flair序列的纹理特征,16个T1ce序列的纹理特征以及ED、ET、NCR这3个肿瘤子区域的16个纹理特征,共70种特征。表1中特征名称的书写规则为:模态_纹理矩阵_矩阵属性。
-
为了对比本文提出的脑肿瘤的生存周期预测框架的表现能力,本文在进行相关调研的基础上设计了5种对比实验,前3种为Brats2018 Challenge的脑肿瘤患者存活周期分析赛道中取得前3名算法:Xue[3]、Baid[5]、Weninger[7]。除此之外,本文还通过对当前领域中常用的传统方法的进行了调研,设计了ICA[20]+LR、PCA[21]+RF两种对比实验,其中ICA+LR的计算原理是:提取与本文相同的特征,以ICA为评价准则进行特征选择后用LR进行存活时间的预测。与ICA+LR类似,PCA+RF的计算原理是:提取与本文相同的特征,以PCA为评价准则进行特征选择后用RF进行存活时间的预测。
本文在相同的实验环境下进行了以上对比方法的实验验证。为了直观反映本文提出的基于Adaboost的脑肿瘤患者存活周期分析系统的泛化能力,本文按照Brats2018 的评测方法进行评测,即将回归问题转为分类问题进行评测。在本文提出的分析模型输出相关样本的存活周期预测结果之后,按照Brats2018的方法将预测结果映射为3个类别:长期、中期、短期,再以3个存活类别的分析准确率作为评测结果。其中,长期为样本的存活周期大于15个月,中期为存活周期大于10个月小于15个月,短期为存活周期小于15个月。为了得到准确、可靠、有说服力的实验结果,本文对整个训练验证的过程进行5折交叉验证,并以5折交叉验证结果的均值作为最终输出结果,具体实验结果如表2所示。通过表2可以看出,本文提出的脑肿瘤患存活周期分析系统的预测准确率优于Xue、Baid和Weninger的方法,其中比Xue的方法提高了5%,比Baid提高了18.35%,比Weninger提高了9.66%,比ICA+LR提高了10.625%,比PCA+RF的方法提高了14.375%。从以上实验结果可以得出,对于基于MR的脑肿瘤患者存活分析来说,显著特征的选择至关重要。本文在特征选择阶段选取了一个包含了70种特征的特征子集,特征子集的个数既保证了特征中相对较低的冗余度,又最大程度地保留了显著特征。相较于Xue、Weninger的方法,本文提取和选择的特征是以上两种方法的8~35倍,提升了显著特征的范围,从而为提升脑肿瘤患者存活分析的准确率提供更多可学习特征。相较于Baid的方法,本文通过特征选择得到的特征子集是其应用特征的1/7,降低了可训练特征的冗余度,减小了噪声特征的影响,从而为提升脑肿瘤患者存活分析的准确率提供了低冗余有益信息。基于传统降维的方法在处理大量特征的时候可能会产生部分显著特征丢失的问题,从而限制了传统机器学习分析方法的分析效果,所以本文也比基于降维的传统方法有实质提升。
序号 特征名称 序号 特征名称 1 T1_glcm_Imc2 36 Flair_gldm_SDE 2 T1_glrlm_RLNU 37 Flair_gldm_SDHGLE 3 T1_glrlm_SRHGLE 38 Flair_gldm_SDLGLE 4 T1_glszm_LAHGLE 39 T1ce_glcm_DE 5 T1_glszm_SZNUN 40 T1ce_glcm_SE 6 T1_glszm_SAE 41 T1ce_glrlm_LRHGLE 7 T1_glszm_SAHGLE 42 T1ce_glrlm_RLNU 8 T1_glszm_ZE 43 T1ce_glszm_GLNUN 9 T1_gldm_DV 44 T1ce_glszm_GLV 10 T1_gldm_LDHGLE 45 T1ce_glszm_LAHGLE 11 T1_gldm_LDLGLE 46 T1ce_glszm_LGLZE 12 T1_gldm_SDE 47 T1ce_glszm_SZNUN 13 T1_gldm_SDHGLE 48 T1ce_glszm_SALGLE 14 T1_gldm_SDLGLE 49 T1ce_glszm_ZE 15 T2_glcm_Imc1 50 T1ce_gldm_LDHGLE 16 T2_glcm_Imc2 51 T1ce_gldm_LDLGLE 17 T2_glrlm_RLNU 52 T1ce_gldm_SDE 18 T2_glszm_SZNUN 53 T1ce_gldm_SDHGLE 19 T2_glszm_SALGLE 54 T1ce_gldm_SDLGLE 20 T2_glszm_ZE 55 Ncr_glrlm_RE 21 T2_gldm_DV 56 Ncr_glrlm_RLNUN 22 T2_gldm_LDLGLE 57 Ncr_glszm_SAE 23 T2_gldm_SDE 58 Ncr_glszm_ZP 24 T2_gldm_SDHGLE 59 Ed_glszm_GLNU 25 T2_gldm_SDLGLE 60 Ed_glszm_SZNUN 26 Flair_glrlm_RLNU 61 Ed_glszm_SAHGLE 27 Flair_glrlm_SRHGLE 62 Ed_glszm_SALGLE 28 Flair_glszm_SZNUN 63 Ed_gldm_SDHGLE 29 Flair_glszm_SAE 64 Ed_gldm_SDLGLE 30 Flair_glszm_SALGLE 65 Et_glrlm_GLNU 31 Flair_glszm_ZP 66 Et_glrlm_RV 32 Flair_glszm_ZV 67 Et_glszm_LALGLE 33 Flair_gldm_DV 68 Et_gldm_DNU 34 Flair_gldm_LDHGLE 69 Et_gldm_DV 35 Flair_gldm_LDLGLE 70 Et_gldm_GLNU 算法 准确率 /% Xue 48.750 Baid 35.400 Weninger 44.090 ICA+LR 43.125 PCA+RF 39.375 本文 53.750