基于无创参数辨识急性呼吸窘迫综合征患者疾病严重程度的算法研究_《生物医学工程学杂志》

作者：

杨鹏程 ^1,2 , 陈锋 ¹ , 张广 ¹ , 余明 ¹ , 吕蒙 ¹ , 王春晨 ¹ , 王春飞 ³ ,  吴太虎 ¹

1. 军事科学院系统工程研究院卫勤保障技术研究所（天津 300161）;
2. 解放军第 12 医院信息科（新疆喀什 844000）;
3. 解放军第 174 医院医学工程科（福建厦门 361000）;

关键词：

急性呼吸窘迫综合征集成学习机器学习无创辨识

DOI：

10.7507/1001-5515.201801081

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

急性呼吸窘迫综合征（ARDS）是一种严重威胁人类生命健康的疾病，具有起病急、病死率高等特点。目前这种疾病的主要诊断和疾病严重程度分级标准依赖于血气分析结果，从而计算患者的氧合指数（PaO₂/FiO₂，P/F），但是血气分析是有创操作，且不能连续监测病情的发展。针对以上问题，我们提出了一种新的 ARDS 疾病严重程度的辨识算法。基于患者的多种无创生理参数，结合特征选择技术，对多种生理参数进行重要性排序。利用交叉验证技术评估辨识性能，比较不同特征子集下，使用神经网络、逻辑回归、AdaBoost、Bagging 四种监督学习算法的分类结果。通过不同特征子集下不同算法的敏感性、特异性、准确率、曲线下面积（AUC）来综合选择最优的特征子集和分类算法。我们利用四种监督学习算法，对 ARDS 严重程度进行区分（P/F ≤ 300）。根据 AUC 来评估算法性能，AdaBoost 在使用 20 个特征时，AUC = 0.832 1，准确率为 74.82%，取得了最优的 AUC。根据特征个数来评估算法性能，Bagging 在使用 2 个特征时，AUC = 0.819 4，准确率为 73.01%。该方法相较于传统方法有较大的优势，能够连续监测 ARDS 患者的病情发展，为医务人员提供辅助诊断建议。

引用本文： 杨鹏程, 陈锋, 张广, 余明, 吕蒙, 王春晨, 王春飞, 吴太虎. 基于无创参数辨识急性呼吸窘迫综合征患者疾病严重程度的算法研究. 生物医学工程学杂志, 2019, 36(3): 435-443. doi: 10.7507/1001-5515.201801081 复制

引言

急性呼吸窘迫综合征（acute respiratory distress syndrome，ARDS）是一种严重威胁人类生命健康的临床综合征，主要表现为各种肺内和肺外致病因素所导致的急性弥漫性肺损伤和进而发展的急性呼吸衰竭^[1]。引起 ARDS 的原因和危险因素众多，这些因素常常相互重叠，从而导致该病的病死率很高。根据相关流行病学调查研究显示，ARDS 的院内死亡率高达 50% 左右^[2–4]。目前，对于 ARDS 疾病的诊断主要依据 2012 年的柏林定义，将氧合指数［动脉血氧分压（PaO₂）/吸入氧浓度（FiO₂），P/F 值］ ≤ 300 作为诊断 ARDS 的标准，同时根据 P/F 值将 ARDS 区分为轻度（200 < P/F ≤ 300）、中度（100 < P/F ≤ 200）、重度 ARDS（P/F ≤ 100）^[5]。但是就目前使用血气分析测量 PaO₂ 从而计算 P/F 值来评估 ARDS 严重程度来看，还存在一些缺陷^[6]。首先，P/F 值的计算需要进行血气分析，目前血气分析采用的动脉留置导管日常护理工作较为困难；其次，对于一些特殊患者如新生儿、贫血患者、老年患者等，动脉采血并不容易操作^[7]；最后，动脉血气分析不是实时监测结果，不能及时反映患者的病情发展，由于缺乏 P/F 结果，不能及时准确地诊断 ARDS，从而使医生无法采取合适的治疗策略，延误患者的诊断和治疗^[8]。

近年来，有研究人员针对血气分析存在的诸多问题，探索使用无创参数血氧饱和度（SpO₂）/FiO₂（S/F）来估测 P/F，从而实现 ARDS 疾病的辨识^[9–11]。但是现阶段的研究主要使用 SpO₂ 单一参数，利用传统的线性回归算法，且对 SpO₂ 有较多的限制，使得这些方法很难在临床中为医务人员提供准确的指导。而有研究显示，对于 ARDS 患者，其 P/F 发生改变的过程中，患者的多个生理参数如心率、血压、呼吸频率等都会发生不同程度的改变，这为我们的课题提供了思路^[12]。

针对以上问题，本研究建立了一种基于多种无创生理参数辨识 ARDS 的算法模型。本模型利用特征选择算法，结合交叉验证技术评估神经网络、逻辑回归、Bagging、AdaBoost 四种算法在不同特征子集下的辨识效果，结合多种评价指标，比较不同算法与特征子集的组合辨识 ARDS 的能力。

1 数据来源

1.1 数据库介绍

MIMIC-III（Medical Information Mart for Intensive Care）是由麻省理工学院和贝斯以色列女执事医疗中心（Beth Israel Deaconess Medical Center，BIDMC）共同开发的一个大型的单中心重症监护医学信息数据库，目前可免费申请使用^[13]。截至目前，数据库中包含了 2001 年至 2012 年期间 BIDMC 重症监护病房的 46 476 名患者的相关诊疗信息。

1.2 患者入组条件

本文研究的对象是成年 ARDS 患者。在 MIMIC-III 数据库中，患者的所有疾病诊断信息与 ICD9 编码相对应，疾病诊断表中只有部分患者标注为 ARDS，结合 ICD9 编码选择了疾病为急性肺损伤（acute lung injury，ALI）的患者。为了保证入组患者疾病诊断的准确性，本研究结合 2012 年的 ARDS 柏林诊断标准，对患者进行进一步的核查，制定了相应的患者入组标准：① 患者年龄大于 16 周岁；② 在 ICU 停留时间超过 48 h：如果停留时间太短，这部分患者的病情很难判断，也会对整体数据造成不必要的干扰；③ 只选择第一次进入 ICU 的患者的数据：如果一个患者多次进入 ICU，则有可能是患者病情较为复杂，有可能会对实验结果造成影响，所以在本文中，只使用每个患者第一次进入 ICU 的数据；④ 在 ICU 期间进行过胸部影像学检查；⑤ 在 ICU 期间进行了机械通气的患者：包括有创通气和无创通气患者；⑥ 第一天出现过 P/F 小于 300 的情况：第一天的 P/F 最小值小于 300 就认为符合条件。图 1 所示为筛选患者的流程图，详细记录了数据筛选的过程，最终入组患者人数为 2 952 人，对应的观测值为 75 293 个。

图1 患者筛选流程图 Figure1. The flow chart for patient selection

图选项

辨识类别	真实类别
辨识类别	阳性（P/F ≤ 300）	阴性（P/F > 300）
阳性	真阳性（TP）	假阳性（FP）
阴性	假阴性（FN）	真阴性（TN）

变量	分布情况（n = 2 952）
年龄/岁	61.06 ± 16.70
性别
女性	1 292（43.77%）
男性	1 660（56.23%）
种族
白种人	2 104（71.27%）
非裔美国人	216（7.32%）
拉丁美洲人	77（2.61%）
亚洲人	67（2.27%）
其他	488（16.53%）
ICU 种类
CCU（冠心病重症监护室）	420（14.23%）
MICU（内科重症监护病房）	1 658（56.17%）
SICU（外科重症监护病房）	464（15.72%）
CSRU（心脏外科康复科）	410（14.23%）
ARDS 诱因
肺炎（Pneumonia）	648（21.95%）
休克（Shock）	502（17.01%）
脓毒血症（Sepsis）	694（23.51%）
创伤（Trauma）	511（17.31%）
其他（Other）	597（20.22%）
ICU 停留时间/d	11.12 ± 9.91
院内死亡率	22.96%
注：表中参数具体值为和百分比（%）

参数	总体样本（n = 75 293）	PF>300（n = 17 096）	PF≤300（n = 58 197）	P值
患者基本信息
年龄/岁	61.06 ± 16.70	61.37 ± 17.44	60.90 ± 16.52	0.023
BMI	30.66 ± 9.93	28.74 ± 7.83	31.22 ± 10.30	< 0.001
生理参数
心率/bpm	89（76-102）	87（75-100）	89（77-102）	< 0.001
体温/℃	37.11 ± 0.92	36.99 ± 0.91	37.15 ± 0.92	< 0.001
无创血压
NBPS/mm Hg	113.57 ± 16.23	114.12 ± 23.78	111.83 ± 22.42	< 0.001
NBPD/mm Hg	57.80 ± 10.49	59.69 ± 16.37	57.82 ± 15.07	< 0.001
NBPM/mm Hg	72.32 ± 9.48	73.74 ± 16.57	71.74 ± 15.31	< 0.001
有创血压
有创收缩压/mm Hg	116.72 ± 22.83	119.16 ± 23.27	116.01 ± 22.65	< 0.001
有创舒张压/mm Hg	59.78 ± 13.18	61.09 ± 13.70	59.40 ± 12.99	< 0.001
有创平均压/mm Hg	79.00 ± 18.27	80.86 ± 17.89	78.46 ± 18.34	< 0.001
SpO₂（%）	96.76 ± 4.33	98.61 ± 3.65	96.20 ± 4.39	< 0.001
呼吸相关参数
呼吸频率/cpm	21（16-26）	19（16-24）	21（17-26）	< 0.001
FiO₂（%）	54.08 ± 18.14	45.82 ± 14.53	56.92 ± 18.54	< 0.001
PEEP/cm H₂O	8（5-10）	5（5-8）	8（5-12）	< 0.001
PIP/cm H₂O	25.79 ± 8.79	22.95 ± 8.03	26.65 ± 9.01	< 0.001
PLAP/cm H₂O	21.87 ± 6.81	20.84 ± 5.42	24.42 ± 6.70	< 0.001
MAP/cm H₂O	13.26 ± 5.59	10.93 ± 4.30	13.93 ± 5.73	< 0.001
TV/mL	520.92 ± 132.26	516.27 ± 132.49	521.47 ± 131.85	0.002
MV/（L·min^-1）	10.66 ± 3.33	9.83 ± 3.27	10.91 ± 3.33	< 0.001
血气分析
S/F	195.56 ± 53.10	229.39 ± 49.11	184.42 ± 50.12	< 0.001
P/F	231.46 ± 118.21	396.97 ± 111.98	182.45 ± 64.53	< 0.001
OSI	7.91 ± 6.95	5.20 ± 3.16	8.74 ± 7.44	< 0.001
OI	8.10 ± 7.70	2.90 ± 1.31	9.64 ± 8.12	< 0.001
注：表中参数具体值为、百分比（%）、中位数（四分位数），OI = （MAP × FiO₂ × 100）/PaO₂

算法	特征值个数	训练集					验证集
算法	特征值个数	敏感性（%）	特异性（%）	NPV （%）	PPV （%）	准确率（%）	敏感性（%）	特异性（%）	NPV （%）	PPV （%）	准确率（%）	AUC
神经网络	19	76.67	73.36	76.11	74.42	75.01	76.27	73.28	91.64	45.28	73.94	0.824 2
逻辑回归	20	75.93	73.37	75.30	74.04	74.65	75.74	73.27	91.41	44.67	73.81	0.819 3
AdaBoost	20	77.87	74.35	77.06	75.22	76.11	77.17	74.15	91.96	45.96	74.82	0.832 1
Bagging	2	78.01	71.89	76.73	73.60	74.98	77.56	71.71	91.86	44.00	73.01	0.819 4

1.	葛均波, 徐永健. 内科学. 第8版. 北京: 人民卫生出版社, 2013.
2.	Bellani G, Laffey J G, Pham T, et al. Epidemiology, patterns of care, and mortality for patients with acute respiratory distress syndrome in intensive care units in 50 countries. JAMA, 2016, 315(8): 788-800.
3.	Riviello E D, Kiviri W, Twagirumugabe T, et al. Hospital incidence and outcomes of the acute respiratory distress syndrome using the Kigali modification of the Berlin definition. Am J Respir Crit Care Med, 2016, 193(1): 52-59.
4.	Maybauer M O, Maybauer D M, Herndon D N. Incidence and outcomes of acute lung injury. N Engl J Med, 2006, 354(4): 416-417.
5.	Ranieri V M, Rubenfeld G D, Thompson B T, et al. Acute respiratory distress syndrome the Berlin definition. JAMA, 2012, 307(23): 2526-2533.
6.	Luo L, Shaver C M, Zhao Z G, et al. Clinical predictors of hospital mortality differ between direct and indirect ARDS. Chest, 2016, 151(4): 755-763.
7.	Garland A. Arterial lines in the ICU: a call for rigorous controlled trials. Chest, 2014, 146(5): 1155-1158.
8.	向有喜, 彭菲, 彭再梅. 急性呼吸窘迫综合征的诊治现状与展望. 中华急诊医学杂志, 2017, 26(3): 255-259.
9.	Bilan N, Dastranji A, Ghalehgolab Behbahani A. Comparison of the SpO₂/FiO₂ ratio and the PaO₂/FiO₂ ratio in patients with acute lung injury or acute respiratory distress syndrome. Chest, 2007, 132(2): 410-417.
10.	滕丽华, 谢志毅, 徐军, 等. 以 SpO_2 替代 PaO_2 评估急性呼吸窘迫综合征机械通气患者脱机指征的可行性分析. 临床误诊误治, 2017(7): 62-65.
11.	Brown S M, Grissom C K, Moss M, et al. Non-linear imputation of PaO₂/FIO₂, from SpO₂/FIO₂, among patients with acute respiratory distress syndrome. Chest, 2016, 150(2): 307-313.
12.	Ahmed A, Kojicic M, Herasevich V, et al. Early identification of patients with or at risk of acute lung injury. Netherlands Journal of Medicine, 2009, 67(9): 268-271.
13.	Johnson A E W, Pollard T J, Shen Lu, et al. MIMIC-III, a freely accessible critical care database. Scientific Data, 2016, 3: 160035.
14.	Scheuren F. Multiple imputation. American Statistician, 2005, 59(4): 315-319.
15.	Alonso-Atienza F, Morgado E, Fernández-Martínez L, et al. Detection of life-threatening arrhythmias using feature selection and support vector machines. IEEE Trans Biomed Eng, 2014, 61(3): 832-840.
16.	Benesty J, Chen J, Huang Y, et al. Pearson correlation coefficient. Noise Reduction in Speech Processing. Springer Berlin Heidelberg: 2009: 1-4.

《生物医学工程学杂志》

基于无创参数辨识急性呼吸窘迫综合征患者疾病严重程度的算法研究

摘要 全文 图表 视频 参考文献 施引文献 补充材料

引言

1 数据来源

1.1 数据库介绍

1.2 患者入组条件

1.3 患者生理参数提取

2 实验方法

2.1 数据预处理

2.2 特征值选择

2.3 辨识算法及性能评估方法

2.3.1 辨识算法

2.3.2 评价指标

3 实验结果

3.1 特征值选择结果

3.2 辨识算法结果

4 讨论

引言

1 数据来源

1.1 数据库介绍

1.2 患者入组条件

1.3 患者生理参数提取

2 实验方法

2.1 数据预处理

2.2 特征值选择

2.3 辨识算法及性能评估方法

2.3.1 辨识算法

2.3.2 评价指标

3 实验结果

3.1 特征值选择结果

3.2 辨识算法结果

4 讨论

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料