CT影像组学分层鉴别三种常见孤立性肺结节的价值

文章快速检索

引用本文

牟科, 范卫杰, 杨燕, 王正明, 文利, 刘欢, 刘浩, 张冬. CT影像组学分层鉴别三种常见孤立性肺结节的价值[J]. 陆军军医大学学报, 2024, 46(6): 608-617. DOI: 10.16016/j.2097-0927.202309082 复制到剪切板

MU Ke, FAN Weijie, YANG Yan, WANG Zhengming, WEN li, LIU Huan, LIU Hao, ZHANG Dong. Stratified differentiation of 3 common pulmonary nodules with CT radiomics[J]. Journal of Army Medical University, 2024, 46(6): 608-617. DOI: 10.16016/j.2097-0927.202309082 复制到剪切板

这篇开放获取文章遵循CC BY许可协议

CT影像组学分层鉴别三种常见孤立性肺结节的价值

牟科¹, 范卫杰¹, 杨燕¹, 王正明¹, 文利¹, 刘欢², 刘浩³, 张冬¹

1. 400037 重庆，陆军军医大学(第三军医大学)第二附属医院放射科;
2. 201203 上海，通用电气药业(上海)有限公司;
3. 100089 北京，北京医准智能科技有限公司

收稿: 2023-09-15；修回: 2023-12-20

基金项目: 重庆英才计划(CQYC202103075)

通信作者: 张冬，E-mail：hszhangd@163.com

[摘要] 目的探讨基于CT影像组学特征的逻辑回归(LR)模型分层鉴别肺孤立性腺癌、结核、非结核炎性结节的价值。方法回顾性分析2018年1月至2022年1月于陆军军医大学第二附属医院经病理证实为肺腺癌、结核、非结核炎性结节患者的临床和肺部CT资料。通过勾画肺结节感兴趣区并提取、筛选CT影像组学特征，分别建立肺腺癌与炎性结节预测模型以及结核与非结核炎性结节预测模型。通过绘制ROC并计算AUC、灵敏度和特异度评估模型效能。结果共收集526例孤立性肺结节，其中肺腺癌263例，结核结节99例，非结核炎性结节164例。基于CT影像组学特征和临床危险因素建立的肺腺癌与炎性结节LR预测模型在训练集中和测试集中的AUC分别为0.880、0.886。基于CT影像组学特征建立的结核与非结核炎性结节LR预测模型在训练集中和测试集中的AUC分别为0.921、0.853。结论基于CT影像组学特征建立的LR预测模型在分层鉴别3种常见孤立性肺结节中具有较好的性能，具有较高的临床应用价值。

[关键词] 肺结节 CT 影像组学列线图诊断

Stratified differentiation of 3 common pulmonary nodules with CT radiomics

MU Ke¹, FAN Weijie¹, YANG Yan¹, WANG Zhengming¹, WEN li¹, LIU Huan², LIU Hao³, ZHANG Dong¹

1. Department of Radiology, Second Affiliated Hospital, Army Medical University (Third Military Medical University), Chongqing, 400037;
2. General Electric Pharmaceuticals (Shanghai) Co., Ltd., Shanghai, 201203;
3. Beijing Medical Standard Intelligent Technology Co., Ltd., Beijing, 100089, China

Supported by the Chongqing Talent Program (CQYC202103075)

Corresponding author: ZHANG Dong, E-mail: hszhangd@163.com.

[Abstract] Objective To explore the value of a logistic regression (LR) model based on CT radiomics features for the stratified classification of isolated adenocarcinoma pulmonary nodules, tuberculous nodules and non-tuberculous inflammatory pulmonary nodules. Methods The clinical and CT data of the patients pathologically diagnosed with pulmonary adenocarcinoma, tuberculosis, and non-tuberculous inflammatory nodules in our hospital between January 2018 and January 2022 were collected and retrospectively analyzed. By contouring the region of interest for pulmonary nodules and extracting CT radiomics features, prediction models were established to distinguish pulmonary adenocarcinoma vs inflammatory nodules and tuberculosis vs non-tuberculous inflammatory nodules. The model's performance was assessed by plotting receiver operating characteristic (ROC) curves and calculating area under curve (AUC), sensitivity, and specificity. Results A total of 526 solitary pulmonary nodules were collected, including 263 cases of pulmonary adenocarcinoma, 99 cases of tuberculous nodules, and 164 cases of non-tuberculous inflammatory nodules. In the training and validation sets, the LR models based on CT radiomics features and clinical risk factors achieved an AUC value of 0.880 and 0.886, respectively, for distinguishing pulmonary adenocarcinoma from inflammatory nodules. For discriminating tuberculosis versus non-tuberculous inflammatory nodules, the LR models based on CT radiomics features yielded an AUC value of 0.921 in the training set and of 0.853 in the validation set. Conclusion The LR prediction models based on CT radiomics features demonstrate excellent performance in hierarchically identifying the 3 prevalent solitary pulmonary nodules, with substantial clinical significance.

[Key words] pulmonary nodule computed tomography radiomics nomogram diagnosis

肺部低剂量螺旋电子计算机断层扫描(computed tomography，CT)以及肺结节人工智能辅助诊断的广泛应用，显著提高了肺结节的检出率^[1]。目前，肺癌5年生存率低于16%，其中Ⅰ期肺癌患者手术后的5年生存率可达70%~90%，因此早期诊断有利于患者接受及时治疗，从而促进患者预后^[2]。炎性结节需常规抗炎治疗，其中结核结节需采用抗结核药物治疗^[3-4]。因此精准诊断肺结节类型可有效指导临床治疗，同时可避免因过度检查导致医疗资源的浪费。

孤立性肺结节早期常无典型症状，影像学检查和实验室检查缺乏特征性表现和指标。影像组学是基于大数据技术和计算机辅助诊断的新兴技术^[5]，通过挖掘并提取医学图像中肉眼无法辨别的具有临床价值的信息，能够对疾病的分类、分型、预后等进行预测^[6-8]。既往影像组学研究多集中在肺结节良恶性鉴别诊断方面，仅有少数研究探讨了其在鉴别良性结节中结核和非结核炎性结节中的价值^[9-10]。鉴于此，本研究拟基于CT影像组学特征建立3种常见孤立性肺结节的分层鉴别诊断模型。

1 资料与方法 1.1 研究对象

本研究经陆军军医大学第二附属医院伦理委员会审核批准(2020-研第141-01)，本研究回顾性收集既往检查的数据，未对患者的临床管理进行任何干预，因此免除了知情同意的要求。所有操作按照批准的研究方案和回顾性研究规定进行。

回顾性收集陆军军医大学第二附属医院2018年1月至2022年1月的肺结节手术患者的临床资料及低剂量肺部螺旋CT扫描影像资料。纳入标准：①在胸外科行手术治疗的肺结节患者，且术前在本院做过肺部低剂量螺旋CT检查；②病理结果证实为腺癌结节、结核结节、非结核炎性结节；③低剂量螺旋CT检查前未进行过穿刺等有创操作。排除标准：①肺结节数量超过1枚或结节直径＞30 mm；②CT图像伪影干扰；③行CT扫描前进行过放、化疗等相关治疗。最终纳入腺癌结节263例，其中男性91例，女性172例，年龄20~78(50.27±12.02)岁；非结核炎性结节164例，其中男性94例，女性70例，年龄18~77(50.32±9.39)岁；结核结节99例，其中男性62例，女性37例，年龄23~70(48.47±10.47)岁。

1.1.1 患者CT扫描

患者肺部低剂量CT图像均由美国GE Optima CT660采集，扫描参数如下：管电压100 kV，自动管电流调制，噪声指数14，采集矩阵512×512，扫描层厚0.625 mm，层间距0.625 mm，螺距1.375。重建算法为肺窗标准算法，无间隔连续重建，重建层厚5 mm。将所有的CT图像临床数据脱敏处理后，经PACS以DICOM格式导出。

1.1.2 患者实验室资料收集

在医院信息系统(hospital information system, HIS)上，采集患者术前的一般资料及实验室资料，包括性别、年龄、炎症指标、结核指标、肿瘤标志物，炎症指标包括C反应蛋白(C-reactive protein, CRP)、白细胞(White blood cell, WBC)计数及血沉(erythrocyte sedimentation rate, ESR)，结核指标包括结核菌素纯化蛋白衍生物(purified protein derivation, PPD)试验或结核感染T细胞干扰素, 肿瘤标志物包括癌胚抗原(carcinoma embryonic antigen, CEA)、糖类抗原(carbohydrate antigen 153, CA153)、神经元烯醇化酶(neuron specific enolase, NSE)、鳞状细胞癌抗原(squamous cell carcinoma antigen, SCC)、细胞角蛋白19片段(cyfra21-1)、铁蛋白(serum ferritin, SF)、糖类抗原(carbohydrate antigen 125, CA125)、胃泌素释放肽前体(pro-gastrin-releasing peptide，ProGRP)。

1.2 方法

1.2.1 肺结节图像分割

在图像分割前，先将原始图像导入AK平台进行预处理。首先对CT图像重采样，将图像空间分辨率调整为1 mm×1 mm×1 mm，图像灰度值范围0~255，然后进行灰度归一化，均数为0，方差为1。放射科医师A参照肺结节数据标注与质量控制专家共识^[11]，在不对结节进行外扩的情况下，对所有结节进行半自动分割，必要时手动校正边界。为了评估组内相关系数(intraclass correlation coefficient, ICC)随机抽取50例结节由放射科医师B进行单独分割，放射科医师A在1个月后再次分割。由标注组长和仲裁专家(均为有15年以上工作经验的高级职称医师)进行审核与修改，最终确定肺结节感兴趣区域(region of interest, ROI)，见图 1。

A：CT肺窗原始图像；B：重采样、灰度归一化图像；C：结节分割完成图图 1 肺结节分割示意图

图选项

1.2.2 图像特征提取

将所有分割后的肺结节ROI分别提取851个影像组学特征，并严格参照图像标志物标准倡议(image biomarker standardization initiative，IBSI)^[12]，包括图像的一阶特征、形态特征、灰度共生矩阵特征(gray-level co-occurrence matrix，GLCM)、灰度区域大小矩阵(gray-level size zone matrix，GLSZM)、灰度游程矩阵特征(gray-level run length matrix，GLRLM)、邻域灰度差分矩阵特征(neigbouring graytone difference matrix，NGTIM)，灰度相关矩阵特征(gray level dependence matrix, GLDM)以及小波变换特征。

1.2.3 特征选择

采用ICC对两位测量者提取的影像组学特征进行一致性检验，确保提取的影像组学特征稳定。选择ICC均≥0.75的特征进行后续分析^[13]。

将数据集上传至达尔文科研平台，以7 ∶3的比例随机分层抽样分为训练集和测试集。首先对组学特征值进行最小最大值归一化处理，将特征值通过线性方法转换到(0~1)的范围。再根据显著性筛选，对每个特征使用常见的单变量统计方法(假阳性率)进行特征评估，选择P < 0.05的特征；接着根据逻辑回归(logistic regression，LR)模型进行10折交叉验证，基于LR模型给出的特征重要性分数，并以最优惩罚系数C确定保留的特征；然后用递归特征消除进行迭代筛选，用上一步保留下的所有特征来训练模型，使用交叉验证评估模型的性能，对每个特征的重要性进行排序，去除排名最低的特征，删除特征后重新训练模型，如果模型性能得到改善，则删除下一个排名最低的特征继续训练，如此反复训练，直至模型性能没有改善，则停止删除特征，得到最佳的特征子集；最后将选择的特征纳入LR模型，获得每个特征的系数值，并计算得到影像组学分数。

1.2.4 影像组学模型的建立与评估

分别将筛选的临床危险因子或影像组学特征单独纳入LR模型，建立临床预测模型、影像组学预测模型，随后将临床特征变量、影像组学模型的影像组学标签相结合，建立联合预测模型。首先建立腺癌结节与炎性结节鉴别模型，再建立结核结节和非结核炎性结节鉴别模型。通过绘制受试者工作特征(receiver operating characteristic，ROC)曲线评估模型的诊断性能，各模型两两间ROC曲线下面积(area under receiver operating characteristic curve，AUC)差异采用DeLong检验比较，模型间AUC差异估计的可靠性用标准误差(standard error，SE)衡量，通过P值判断模型间AUC差异是否存在统计学意义，然后绘制列线图(nomogram)对模型进行可视化分析。通过绘制决策曲线，评估模型的临床实用价值。

1.3 统计学分析

使用SPSS 22.0统计学软件对两组患者的临床特征进行统计分析。分类变量用例数和频数表示，采用χ²检验或Fisher检验进行分析；对于服从正态分布的连续变量用x±s来表示，采用独立样本t检验；对于不服从正态分布的连续变量用中位数和四分位数[M(P₂₅，P₇₅)]表示，采用非参数Mann-Whitney U检验。此外，影像组学特征选择、模型的构建和评估均使用达尔文科研平台。所有的统计学均为双侧检验，P < 0.05为差异具有统计学意义。

2 结果 2.1 研究对象一般临床资料

将肺腺癌结节与炎性结节组中526例患者以7 ∶3的比例随机分层抽样分为训练集和测试集；训练集368例，其中腺癌结节、炎性结节均为184例；测试集158例，其中腺癌结节、炎性结节均为79例。一般临床资料统计结果如表 1所示。性别采用χ²检验；所有连续变量均不服从正态分布，采用非参数Mann-Whitney U检验。性别、NSE在两组之间的差异具有统计学意义(P < 0.05)。其余变量在两组之间差异无统计学意义(P>0.05)。

表 1 腺癌结节与炎性结节组一般临床资料与实验室检查资料[例(%)，M(P₂₅，P₇₅)]

指标		训练集(n=368)			测试集(n=158)
指标		腺癌结节(n=184)	炎性结节(n=184)	P值	腺癌结节(n=79)	炎性结节(n=79)	P值
性别	女性	118(64.13)	80(43.48)	< 0.001^a	54(68.35)	27(34.18)	< 0.001^a
	男性	66(35.87)	104(56.52)		25(31.65)	52(65.82)
年龄/岁		49.50(41.75, 56.00)	49.00(44.00, 54.00)	0.466	52.00(42.00, 62.00)	51.00(46.00, 56.00)	0.921
白细胞/(10⁹/L)		5.23(4.26, 6.32)	5.43(4.84, 6.48)	0.213	5.61(4.43, 6.98)	5.48(4.98, 6.46)	0.398
癌胚抗原/(ng/mL)		1.52(1.07, 2.38)	1.59(1.19, 2.55)	0.341	1.75(1.19, 2.41)	1.83(1.28, 2.70)	0.286
糖类抗原CA153/(U/mL)		8.40(6.38, 11.20)	9.11(7.00, 12.55)	0.111	8.00(6.60, 11.33)	9.50(6.20, 13.80)	0.083
神经元烯醇化酶/(ng/mL)		11.54(9.58, 13.34)	9.85(8.31, 11.89)	0.007	11.73(10.29, 13.82)	10.19(8.10, 11.64)	< 0.001
鳞状细胞癌抗原/(ng/mL)		0.70(0.50, 0.94)	0.70(0.60, 1.00)	0.442	0.70(0.50, 0.91)	0.70(0.55, 1.00)	0.350
细胞角蛋白19片段/(ng/mL)		1.41(1.01, 1.89)	1.47(0.94, 1.96)	0.891	1.32(0.98, 1.76)	1.46(1.04, 1.99)	0.121
铁蛋白(ng/ml)		132.63(55.97, 218.96)	145.41(75.03, 234.28)	0.121	157.53(72.91, 244.30)	146.28(88.92, 258.72)	0.416
糖类抗原CA125/(U/mL)		11.70(9.00, 16.63)	12.10(8.78, 16.28)	0.239	13.00(7.65, 15.75)	11.10(7.40, 14.15)	0.162
胃泌素释放肽前体/(pg/mL)		34.99(28.16, 42.59)	32.22(26.93, 41.50)	0.091	33.52(28.04, 41.44)	32.24(25.78, 40.75)	0.376
a：对于性别采用χ²检验；其余指标为不服从正态分布的连续变量，采用非参数Mann-Whitney U检验

表选项

将肺腺癌结节与炎性结节组的训练集数据进行单多因素逻辑回归分析，结果显示，性别、NSE是肺结节为腺癌的独立预测因子(P < 0.05，表 2)。

表 2 腺癌结节与炎性结节组训练集临床数据单多因素逻辑回归分析

因素	单因素分析			多因素分析
因素	OR	95%CI	P值	OR	95%CI	P值
性别(男/女)	0.430	0.281~0.653	< 0.001	0.415	0.270~0.633	< 0.001
年龄/岁	1.007	0.989~1.026	0.466
白细胞/(10⁹/L)	0.929	0.825~1.042	0.214
癌胚抗原/(ng/mL)	1.014	0.992~1.118	0.510
糖类抗原CA153/(U/mL)	0.966	0.922~1.003	0.134
神经元烯醇化酶/(ng/mL)	1.074	1.021~1.139	0.011	1.076	1.024~1.142	0.009
鳞状细胞癌抗原/(ng/mL)	0.914	0.669~1.134	0.465
细胞角蛋白19片段/(ng/mL)	1.014	0.823~1.252	0.891
铁蛋白/(ng/mL)	0.998	0.997~1.000	0.126
糖类抗原CA125/(U/mL)	1.014	0.991~1.039	0.244
胃泌素释放肽前/(pg/mL)	1.013	0.997~1.030	0.094

表选项

随后，将结核结节和非结核炎性结节组中263例患者以7 ∶3的比例随机分层抽样分为训练集和测试集；训练集184例，其中结核结节69例、非结核炎性结节115例；测试集79例，其中结核结节30例、非结核炎性结节49例。一般临床资料概况如表 3所示，性别采用χ²检验；测试集中年龄服从正态分布，采用独立样本t检验；其余所有连续变量均不服从正态分布，采用非参数Mann-Whitney U检验。仅测试集中NSE在两组之间的差异具有统计学意义(P < 0.05)，其余所有变量在结核结节组和非结核炎性结节组之间差异无统计学意义(P>0.05)。

表 3 结核结节和非结核炎性结节组患者一般临床资料与实验室检查资料[例(%)，M(P₂₅，P₇₅)]

指标		训练集(n=184)			测试集(n=79)
指标		结核结节(n=69)	非结核炎性结节(n=115)	P值	结核结节(n=30)	非结核炎性结节(n=49)	P值
性别	女性	26(37.68)	49(42.61)	0.510^a	11(36.67)	21(42.86)	0.586^a
	男性	43(62.32)	66(57.39)		19(63.33)	28(57.14)
年龄/岁		49.00(42.50, 55.00)	49.00(46.00, 55.00)	0.439	48.73±1.59	50.65±1.16	0.325^b
白细胞/(10⁹/L)		5.64(4.92, 6.35)	5.48(4.83, 6.66)	0.944	5.45(5.00, 6.19)	5.34(4.98, 6.79)	0.369
癌胚抗原/(ng/mL)		1.82(1.28, 2.75)	1.55(1.12, 2.38)	0.156	1.95(1.23, 2.65)	1.83(1.01, 2.79)	0.668
糖类抗原CA153/(U/mL)		9.00(7.10, 14.50)	9.20(6.20, 12.00)	0.348	8.76(7.70, 11.65)	10.30(7.00, 13.80)	0.347
神经元烯醇化酶/ (ng/mL)		9.90(8.67, 11.27)	10.01(8.26, 11.90)	0.734	11.64(9.58, 14.21)	8.98(7.74, 10.85)	0.019
鳞状细胞癌抗原/(ng/mL)		0.80(0.55, 0.90)	0.80(0.50, 1.10)	0.417	0.70(0.55, 0.93)	0.70(0.60, 0.90)	0.360
细胞角蛋白19片段/(ng/mL)		1.56(1.08, 2.07)	1.54(1.03, 2.04)	0.874	1.21(0.98, 1.59)	1.37(0.87, 1.81)	0.724
铁蛋白/(ng/ml)		112.76(61.92, 239.74)	154.09(87.33, 245.98)	0.176	165.57(133.18, 234.51)	132.41(64.95, 237.44)	0.059
糖类抗原CA125/(U/mL)		12.10(8.70, 14.70)	12.20(7.50, 17.40)	0.715	10.95(7.95, 14.08)	11.90(9.00, 16.60)	0.361
胃泌素释放肽前体/(pg/mL)		33.43(27.91, 41.19)	31.13(25.02, 40.90)	0.114	31.39(28.24, 41.68)	35.83(27.57, 44.52)	0.904
a：采用χ²检验；b：采用独立样本t检验；其余指标为不服从正态分布的连续变量，采用非参数Mann-Whitney U检验

表选项

2.2 肺腺癌结节与炎性结节鉴别模型

2.2.1 影像组学标签构建

424个具有较高一致性(ICC≥0.75)的影像组学特征被用于进一步分析。根据显著性特征筛选，保留下269个特征；根据模型筛选，最优惩罚系数C为1.23，保留下15个特征；迭代筛选最终保留下10个最具预测性的CT影像组学特征，特征相应系数可视化如图 2所示。按其系数加权来计算影像组学标签具体公式如下：

图 2 影像组学特征系数

图选项

影像组学标签=-3.622*wavelet.HHL_glrlm_ ShortRunEmphasis-2.476*original_firstorder_RootMeanSquared+ 2.325*wavelet.LLH_glcm_Imc1+2.013*wavelet.LHH_glcm_InverseVariance-1.962*wavelet.LLH_glszm_GrayLevelNonUniformity-1.606*wavelet.HLL_glcm_MaximumProbability+1.545*wavelet.HHL_firstorder_Minimum+1.425*wavelet.HLH_firstorder_Minimum-1.360*wavelet.HHL_firstorder_Maximum-1.046*wavelet.HHL_firstorder_RootMeanSquared-0.615

2.2.2 影像组学模型的评估与验证

在训练集中，临床模型的AUC为0.706，95%可信区间(confidence interval，CI)为0.653~0.758，灵敏度为0.875，特异性为0.435；影像组学模型的AUC为0.874(95%CI：0.838~0.910)，灵敏度为0.848，特异度为0.804；联合模型的AUC为0.880(95%CI：0.844~0.915)，灵敏度为0.886，特异性为0.739。DeLong检验(表 4)显示影像组学模型和联合模型在训练集预测效能均高于临床模型，且AUC差异均具有统计学意义(P < 0.001)，联合模型与影像组学模型间AUC差异无统计学意义(P=0.287)。

表 4 腺癌结节与炎性结节组临床模型、影像组学模型、联合模型的DeLong检验结果

模型	训练集				测试集
模型	AUC差值(95%CI)	SE	Z值	P值	AUC差值(95%CI)	SE	Z值	P值
临床模型vs影像组学模型	0.169(0.109~0.228)	0.030	5.56	< 0.001	0.198(0.098~0.298)	0.051	3.893	< 0.001
临床模型vs联合模型	0.174(0.121~0.227)	0.027	6.459	< 0.001	0.211(0.121~0.302)	0.046	4.574	< 0.001
影像组学模型vs联合模型	0.006(-0.005~0.016)	0.005	1.064	0.287	0.013(-0.002~0.028)	0.008	1.722	0.085

表选项

在测试集中，临床模型的AUC为0.675(95%CI：0.591~0.758)，灵敏度为0.595，特异性为0.684；影像组学模型的AUC为0.873(95%CI：0.818~0.928)，灵敏度为0.785，特异度为0.835；联合模型的AUC为0.886(95%CI：0.834~0.937)，灵敏度为0.924，特异性为0.709。DeLong检验(表 4)显示影像组学模型和联合模型在训练集预测效能均高于临床模型，且AUC均具有统计学差异(P < 0.001)，联合模型与影像组学模型间AUC差异无统计学意义(P=0.085)。模型的ROC曲线如图 3所示；联合模型的可视化列线图如图 4所示。通过决策曲线(图 5)评估显示，该列线图模型在风险阈值＞16%时，较不加影像组学标签模型和全部处理模型具有更好的临床有效性。

A：训练集ROC曲线；B：测试集ROC曲线图 3 肺腺癌结节与炎性结节组联合模型ROC曲线

图选项

图 4 肺腺癌结节与炎性结节组联合模型列线图

图选项

A：联合模型训练集决策曲线；B：联合模型测试集决策曲线图 5 肺腺癌结节与炎性结节组联合模型决策曲线

图选项

2.3 结核结节与非结核炎性结节鉴别模型

2.3.1 影像组学标签构建

424个具有较高一致性(ICC≥0.75)的影像组学特征被用于进一步分析。根据显著性特征筛选，保留下157个特征；根据模型筛选，最优惩罚系数C为1.24，保留下13个特征；通过迭代筛选，最终保留下6个最具预测性的影像组学特征, 特征相应系数可视化如图 6所示。按其系数加权来计算影像组学标签，具体计算公式如下：

图 6 影像组学特征系数

图选项

影像组学标签=6.624*wavelet.LLH_glcm_ MaximumProbability-5.097*original_firstorder_Skewness-3.698*original_ shape_Sphericity-3.524*wavelet.HLH_glcm_InverseVariance-2.790*wavelet.LHL_glszm_LowGrayLevelZoneEmphasis+1.375*original_glcm_Idmn+2.788

2.3.2 影像组学模型的评估与验证

由于训练集中，两组之间临床资料均无统计学差异，因此未建立临床模型及组合模型。在训练集中，影像组学模型的AUC为0.921(95%CI：0.879~0.963)，灵敏度0.870，特异度为0.878。在测试集中，影像组学模型AUC为0.853(95%CI：0.768~0.938)，灵敏度为0.600，特异度0.980。模型的ROC曲线如图 7所示，列线图如图 8所示。通过决策曲线(图 9)评估显示，该列线图模型在风险阈值＞19%时，影像组学模型具有较高的临床实用性。

A：训练集ROC曲线；B：测试集ROC曲线图 7 肺结核结节与非结核炎性结节预测模型ROC曲线

图选项

图 8 肺结核结节与非结核炎性结节预测模型列线图

图选项

A：预测模型训练集决策曲线；B：预测模型测试集决策曲线图 9 肺结核结节与非结核炎性结节预测模型决策曲线

图选项

3 讨论

肺腺癌、结核、非结核炎性结节是常见的肺部结节，三者的临床症状无特异性，影像特征具有重叠性。早期准确判断肺结节性质有助于临床治疗决策的制定、从而改善患者预后。既往肺结节研究侧重于良恶性的判别，对良性结节的分类诊断重视不足。在精准医疗模式的要求下，为减少医疗浪费，有必要对良性结节进行进一步的分类诊断。本研究通过影像组学方法，除了对肺腺癌结节与炎性结节进行鉴别外，还进一步对良性结节中常见的非结核炎性结节和结核结节进行鉴别。研究结果显示良恶性结节预测模型、良性肺结节亚分类预测模型的AUC分别为0.880、0.921，并具有较高的灵敏度和特异性，决策曲线分析其临床效能最优，能够为临床制定诊疗方案带来很好的帮助。

在本研究肺腺癌结节与炎性结节组中，性别、NSE的差异在两组之间具有统计学意义，但对预测肺腺癌结节的风险程度的帮助很小。在结核结节和非结核炎性结节组中，仅测试集中NSE在两组之间的差异具有统计学意义(P < 0.05)，其余临床特征的差异均无统计学意义。DeLong检验结果表明影像组学模型和联合模型的AUC均高于临床模型，联合模型与影像组学模型间AUC差异无统计学意义，进一步说明了影像组学特征在预测肺腺癌结节中的重要性。通过从CT图像提取肺结节的高通量特征，量化深层次的特征研究，可以提高肺结节的分类诊断准确性^[14-15]。

图像分割在影像组学研究中起着关键的作用，手动分割、半自动化分割和自动化分割是常用的分割方式^[16]。吴宇强等^[17]研究表明半自动化分割对于孤立性肺结节提取出来的影像组学参数比较可靠，能够为分类模型提供客观、稳定的信息。本研究采用了半自动分割加手动矫正结节边界确定肺结节病灶，主要优势有3点：第一，比自动分割更精准，能够有效避免周围肺纹理、叶间裂及胸膜的干扰；第二，由于纯磨玻璃结节与正常肺组织灰阶相近，可减少正常组织的干扰^[18]；第三，相对纯手动分割的速度更快、效率更高，并能保证分割的稳定性。最后再通过分析组内相关性系数ICC，进行一致性检验，选择ICC≥0.75的特征，确保提取影像组学特征的可重复性。

小波特征转换可以将原始图像的能量集中在小部分小波系数上，分解后的小波系数在3个方向的细节分量上具有较高的局部相关性^[19]，为特征提取提供了强有力的条件。多个研究表明，小波转变能够有效地去除CT以及磁共振图像中的横纹噪声^[20-21]，在影像组学分类和预测分析中有明显的优势，广泛应用于影像组学及纹理分析的研究中。在本研究中，选取的特征也大多是基于小波转变的特征。最终，分别得到10个与6个影像组学特征进行肺结节分层诊断模型建立。这些特征包括结节的形态、直方图的偏态性，以及高阶特征GLCM、GLDM、GLSZM和GLRLM等。GLCM的纹理特征比直方图更能够显示结节纹理信息^[22]；GLDM描述结节体素与邻域之间的灰度关系，GLSZM在表征结节纹理一致性或斑点状纹理有显著的效果，GLRLM描述有强度体素的排列，在局部尺度上反映结节的异质性^[23]。本研究挖掘的特征可以从图像不同的角度反映两组结节的纹理差别。

逻辑回归分析方法^[24-25]在分类建模上表现出很好的性能，LIU等^[26]利用该方法建立肺结节良恶性鉴别模型的AUC达到0.836。本研究中，由10个影像组学特征建立的良恶性结节预测模型在训练集与测试集的AUC分别为0.874、0.873。然后，将影像组学特征和临床危险因素相结合后，获得组合模型在训练集与测试集的AUC分别0.880和0.886。通过决策曲线表明结合影像标签的模型在风险起始即具有良好的临床效能。因此，本研究基于CT影像组学特征建立的LR模型，能够很好地对3种常见的孤立性肺结节(肺腺癌结节、结核结节和非结核炎性结节)进行分类，这为判断孤立性肺结节性质提供重要参考价值。

本研究有以下几个局限性：本研究的样本量不够大，这可能会影响影像组学模型的性能，今后的工作重点需要进行大规模、多中心的研究。其次，本研究纳入的病例部分实验室资料样本偏少，主要以炎症指标白细胞计数和肿瘤标志物指标为主。尽管影像组学在医学中的应用十分广泛，但特征的稳定性以及冗余性是值得关注的问题。在未来的研究中，扩大样本容量，建立标准的数据库，融合更多的实验室检查指标，采用人工智能自动分割结节的方法，将会更大程度的减少这些局限，进而使分类模型更高效和适用。

综上所述，本研究构建了基于CT影像组学标签和临床危险因素的列线图，研究结果表明：此模型具有较好的预测及分类价值，有望为临床精准诊治肺结节提供依据。

利益冲突声明 本研究过程与结果均未受到相关设备、材料以及药品企业的影响；作者刘欢受雇于通用电气药业(上海)有限公司，刘浩受雇于北京医准智能科技有限公司，所有作者声明没有利益冲突。

参考文献

[1]	WILSON R, DEVARAJ A. Radiomics of pulmonary nodules and lung cancer[J]. Transl Lung Cancer Res, 2017, 6(1): 86-91.
[2]	HUBERS A J, HEIDEMAN D A, DUIN S, et al. DNA hypermethylation analysis in sputum of asymptomatic subjects at risk for lung cancer participating in the NELSON trial: argument for maximum screening interval of 26 years[J]. J Clin Pathol, 2017, 70(3): 250-254.
[3]	MAMISHI S, POURAKBARI B, MORADZADEH M, et al. Prevalence of active tuberculosis infection in transplant recipients: a systematic review and meta-analysis[J]. Microb Pathog, 2020, 139: 103894.
[4]	BAGCCHI S. WHO's global tuberculosis report 2022[J]. Lancet Microbe, 2023, 4(1): e20.
[5]	LAMBIN P, RIOS-VELAZQUEZ E, LEIJENAAR R, et al. Radiomics: extracting more information from medical images using advanced feature analysis[J]. Eur J Cancer, 2012, 48(4): 441-446.
[6]	孟庆成, 高朋瑞, 郭兰伟, 等. 基于多阶段三维深度卷积神经网络的计算机辅助诊断系统在肺癌筛查中的应用[J]. 中华放射学杂志, 2020, 54(6): 552-556. MENG Q C, GAO P R, GUO L W, et al. Application of computer aided diagnosis system based on multi-stage three dimensional deep convolutional neural network in lung cancer screening[J]. Chin J Radiol, 2020, 54(6): 552-556.
[7]	ATHER S, KADIR T, GLEESON F. Artificial intelligence and radiomics in pulmonary nodule management: current status and future applications[J]. Clin Radiol, 2020, 75(1): 13-19.
[8]	WANG X, LI Q C, CAI J L, et al. Predicting the invasiveness of lung adenocarcinomas appearing as ground-glass nodule on CT scan using multi-task learning and deep radiomics[J]. Transl Lung Cancer Res, 2020, 9(4): 1397-1406.
[9]	刘静, 李敏, 刘荣荣, 等. 基于CT图像放射组学的矽肺和肺结核结节鉴别诊断预测模型的建立[J]. 中华劳动卫生职业病杂志, 2019, 37(9): 4. LIU J, LI M, LIU R R, et al. Establishment of a CT image radiomics-based prediction model for the differential diagnosis of silicosis and tuberculosis nodules[J]. Chinese journal of industrial hygiene and occupational diseases, 2019, 37(9): 4.
[10]	樊梦思, 赵红, 曹捍波, 等. 基于CT平扫影像组学模型鉴别结节/肿块型肺隐球菌病及肺腺癌与肺结核[J]. 中国医学影像技术, 2020, 36(6): 853-857. FAN M S, ZHAO H, CAO H B, et al. Differentiation of nodule or mass type pulmonary cryptococcosis and lung adenocarcinoma, lung tuberculosis based on plain CT scanning radiomics models[J]. Chin J Med Imaging Technol, 2020, 36(6): 853-857.
[11]	中国食品药品检定研究院, 中华医学会放射学分会心胸学组, 任海萍, 等. 胸部CT肺结节数据标注与质量控制专家共识(2018)[J]. 中华放射学杂志, 2019, 53(1): 9-15. National Institutes for Food and Drug Control, Cardio-thoracic Working Group, Chinese Society of Radiology, Chinese Medical Association, REN H P, et al. Expert consensus on the rule and quality control of pulmonary nodule annotation based on thoracic CT[J]. Chin J Radiol, 2019, 53(1): 9-15.
[12]	ZWANENBURG A, VALLIÈRES M, ABDALAH M A, et al. The image biomarker standardization initiative: standardized quantitative radiomics for high-throughput image-based phenotyping[J]. Radiology, 2020, 295(2): 328-338.
[13]	WU G Y, WOODRUFF H C, SANDULEANU S, et al. Preoperative CT-based radiomics combined with intraoperative frozen section is predictive of invasive adenocarcinoma in pulmonary nodules: a multicenter study[J]. Eur Radiol, 2020, 30(5): 2680-2691.
[14]	宋兰, 朱振宸, 姜蕾, 等. CT影像组学在预测肺腺癌ALK融合基因表达中的价值初探[J]. 中华放射学杂志, 2019, 53(11): 963-967. SONG L, ZHU Z C, JIANG L, et al. Preliminary value of CT radiomics in predicting anaplastic lymphoma kinase fusion gene expression in lung adenocarcinoma[J]. Chin J Radiol, 2019, 53(11): 963-967.
[15]	QUAN S C, CHEN H, LIN L Y, et al. Automatic CT whole-lung segmentation in radiomics discrimination: methodology and application in pneumonia diagnosis and distinguishment[J]. Displays, 2022, 71: 102144.
[16]	UTHOFF J, NAGPAL P, SANCHEZ R, et al. Differentiation of non-small cell lung cancer and histoplasmosis pulmonary nodules: insights from radiomics model performance compared with clinician observers[J]. Transl Lung Cancer Res, 2019, 8(6): 979-988.
[17]	吴宇强, 秦涛, 马晓臣, 等. 实性孤立性肺结节CT影像组学参数测量的可重复性研究[J]. 放射学实践, 2020, 35(9): 1106-1111. WU Y Q, QIN T, MA X C, et al. Study on the reproducibility of CT-based radiomics features in solid solitary pulmonary nodule[J]. Radiol Pract, 2020, 35(9): 1106-1111.
[18]	ZHANG P J, LI T R, TAO X M, et al. HRCT features between lepidic-predominant type and other pathological subtypes in early-stage invasive pulmonary adenocarcinoma appearing as a ground-glass nodule[J]. BMC Cancer, 2021, 21(1): 1124.
[19]	KANG E, MIN J H, YE J C. A deep convolutional neural network using directional wavelets for low-dose X-ray CT reconstruction[J]. Med Phys, 2016, 44: e360-e375.
[20]	CHOE J, LEE S M, DO K H, et al. Deep learning-based image conversion of CT reconstruction kernels improves radiomics reproducibility for pulmonary nodules or masses[J]. Radiology, 2019, 292(2): 365-373.
[21]	LIAO F Z, LIANG M, LI Z, et al. Evaluate the malignancy of pulmonary nodules using the 3-D deep leaky noisy-OR network[J]. IEEE Trans Neural Netw Learn Syst, 2019, 30(11): 3484-3495.
[22]	WENG Q, ZHOU L, WANG H, et al. A radiomics model for determining the invasiveness of solitary pulmonary nodules that manifest as part-solid nodules[J]. Clin Radiol, 2019, 74(12): 933-943.
[23]	TIXIER F, LE REST CC, HATT M, et al. Intratumor heterogeneity characterized by textural features on baseline 18F-FDG PET images predicts response to concomitant radiochemotherapy in esophageal cancer[J]. J Nucl Med, 2011, 52(3): 369-378.
[24]	范丽, 方梦捷, 董迪, 等. 影像组学对磨玻璃结节型肺腺癌病理亚型的预测效能[J]. 中华放射学杂志, 2017, 51(12): 912-917. FAN L, FANG M J, DONG D, et al. Subtype discrimination of lung adenocarcinoma manifesting as ground glass nodule based on radiomics[J]. Chin J Radiol, 2017, 51(12): 912-917.
[25]	CAI J, LIU H, YUAN H, et al. A radiomics study to predict invasive pulmonary adenocarcinoma appearing as pure ground-glass nodules[J]. Clin Radiol, 2021, 76(2): 143-151.
[26]	LIU A L, WANG Z H, YANG Y C, et al. Preoperative diagnosis of malignant pulmonary nodules in lung cancer screening with a radiomics nomogram[J]. Cancer Commun (Lond), 2020, 40(1): 16-24.

经国家新闻出版署批准，《第三军医大学学报》于2022年第1期更名为《陆军军医大学学报》。国内统一刊号CN50-1223/R，ISSN 2097-0927。主管单位为陆军军医大学，主办单位为陆军军医大学教研保障中心。

文章信息

牟科, 范卫杰, 杨燕, 王正明, 文利, 刘欢, 刘浩, 张冬

MU Ke, FAN Weijie, YANG Yan, WANG Zhengming, WEN li, LIU Huan, LIU Hao, ZHANG Dong

CT影像组学分层鉴别三种常见孤立性肺结节的价值

Stratified differentiation of 3 common pulmonary nodules with CT radiomics

陆军军医大学学报, 2024, 46(6): 608-617

Journal of Army Medical University, 2024, 46(6): 608-617

http://dx.doi.org/10.16016/j.2097-0927.202309082

文章历史

收稿: 2023-09-15

修回: 2023-12-20

文章信息

文章历史

相关文章

工作空间