为了充分挖掘轻度认知障碍(MCI)患者的神经振荡耦合特征,本文分析对比了28名MCI患者(MCI组)与21名正常人(正常对照组)在六种异频组合下的耦合特征强度。结果表明,与正常对照组相比,MCI组在δ-θ节律组合下交叉频率耦合的全局相位同步指数差异具有统计学意义(P = 0.025,d = 0.398)。为了进一步验证此耦合特征,本文提出一种优化的卷积神经网络模型,该模型融入了时频数据增强模块与批归一化层,在防止过拟合的同时增强了模型的鲁棒性。基于此优化模型,以δ-θ节律组合下的锁相值矩阵作为模型输入的单一特征,对MCI患者的诊断正确率达(95.49±4.15)%,敏感性与特异性分别为(93.71 ± 7.21)%和(97.50 ± 5.34)%。本文研究结果表明,δ-θ节律组合下的锁相值矩阵特征能够充分反映MCI患者的认知状态,有利于辅助MCI诊断。
引用本文: 李昕, 王凯, 景军, 尹立勇, 张莹, 谢平. 神经振荡交叉频率耦合特征在轻度认知障碍诊断中的应用研究. 生物医学工程学杂志, 2023, 40(5): 843-851. doi: 10.7507/1001-5515.202210020 复制
0 引言
轻度认知障碍(mild cognitive impairment,MCI)是阿尔兹海默病病程发展的关键阶段,挖掘MCI诊断标记特征,以较小的特征代价实现早期诊断具有临床研究意义[1-4]。现有研究表明,不同脑区之间的信息交流是以神经振荡节律之间有序的神经编码机制完成的,交叉频率耦合(cross-frequency coupling,CFC)作为不同节律局部和整体之间相互作用的载体机制,与分布式的信息整合有直接的联系[5-7]。尤其对于患有认知障碍的人群,由于大脑神经细胞发生病变,导致大脑的功能连接受损,其静息态脑电信号常表现出快振荡减弱、慢振荡增强的现象[8]。
大脑节律间的耦合特征与多重认知和行为相关[9-10]。Schack等[11]通过对实验数据进行双谱分析,发现当大脑处于感知和记忆任务当中时,θ节律的相位可以调制γ节律的幅值,即存在相幅耦合现象。Palva等[12]通过分析受试者在连续心算任务中的脑磁图(magnetoencephalography,MEG)发现,大脑皮层中存在明显的跨频相位耦合现象,且γ节律和α节律的相位耦合强度随着任务难度上升而增强。Yanagisawa等[13]分析感觉运动皮层的脑电数据时,发现α节律与γ节律、β节律与γ节律的相幅耦合强度会随着受试者感知和认知状态的改变而改变。
认知水平下降会导致神经振荡耦合特征异常,如Ahnaou等[14]在阿尔兹海默病小鼠模型中发现了阿尔兹海默病小鼠脑电数据中的θ振荡和相干活动减弱,并且θ-γ振荡的相幅耦合强度明显降低。闫彦等[15]使用非线性相互依赖性的方法观察脑电数据在相同节律下通道间的耦合强度,发现MCI患者(MCI组)脑电数据的θ节律和α节律在不同通道间耦合强度的平均值低于正常人[正常对照(normal controls,NC)组],且其差异具有统计学意义。Liu等[16]在同一节律下不同通道间,采用互信息(mutual information,MI)分析方法量化与任务相关的脑电信号的耦合强度,发现NC组与MCI组的θ节律耦合强度区别明显。
本文基于多层次的相位—幅值耦合方法分析脑电数据,研究MCI组和NC组在不同节律组合下,各通道低频节律相位与高频节律幅值之间的耦合关系。为了进一步挖掘认知下降初期的特征标记,本文以δ-θ节律相幅耦合特征为单一特征,采用批归一化(batch normalization,BN)层优化的卷积神经网络(convolutional neural networks,CNN)模型实现对MCI患者的自动诊断[17]。针对临床数据的小样本问题,本文采用时频数据增强技术,实现样本扩充[18-19]。基于此优化模型,本文验证了所提出的特征作为区分MCI患者和正常人的生物标志的可行性,期望为MCI患者的临床诊断提供理论依据。
1 方法
1.1 数据采集与预处理
本文采用的数据样本来自河北省人民医院,共招募49名受试者参与本研究,其中MCI患者入组28人,平均年龄为(65.2 ± 5.4)岁;NC组21人,平均年龄为(67.1 ± 6.3)岁,均身体健康,没有相关的神经性病症,大脑功能状态正常;所有受试者均自愿参与本文研究并签署了知情同意书。所有受试者均通过磁共振成像(magnetic resonance imaging,MRI)或者计算机断层扫描检查,排除了脑部局灶性病变,并接受了视觉、听觉测试,以及认知测试。其中,认知测试包括简易精神状态检查(mini-mental state examination,MMSE)、蒙特利尔认知评估量表(Montreal cognitive assessment,MoCA)和日常生活活动量表(activities of daily living,ADL)[20]。受试者基本信息如表1所示,数据以均值 ± 标准差显示,并采用独立样本t检验方法比较了MCI组与NC组样本间的差异,检验水准为0.05。
本文试验依据《世界医学协会赫尔辛基宣言》进行,通过了河北省人民医院伦理审查委员会的批准(批文编号:UY202201)。
本文脑电信号采集采用16导通道数字脑电图仪(NT9200,北京中科新拓仪器有限公司,中国)完成,其电极位置符合国际标准10/20系统的规格,采样率为1 024 Hz。采集数据时,受试者均处于清醒、无干扰的状态,试验人员记录受试者在闭眼放松状态下5 min的脑电信号。
本文采用科学计算软件Matlab(2017a,MathWorks,美国)的EEGLAB工具箱基于独立成分分析(independent components analysis,ICA),完成剔除眼电、心电、肌电等干扰信号的预处理工作[21]。为了使每个样本的脑电信号长度相等,本文将所采集的脑电信号进行分段截取,截取位置为采集开始后的32~64 s,共计32 768个数据点。最终,采用带通滤波进行节律分解。
1.2 时频数据增强
针对个体性差异问题,在保持脑电信号原有特性的情况下,本文从时域和频域上实现了数据增强[22]。数据增强步骤如下:
(1)信号分割:将原始脑电信号数据在时域上分割,每段长度为8 192个数据点。
(2)时域重组:随机选择四段脑电信号重新组合,生成人工时域脑电信号。本文共生成400个人工时域脑电信号,其中MCI组与NC组各200个。
(3)频域交换:将人工时域脑电信号进行快速傅里叶变换﹐然后对相同类别脑电信号的同一频段进行随机交换,重新组合成人工时频脑电信号。人工时频脑电信号就是经过数据增强后得到的新样本。本文从200个MCI组人工时域脑电信号和200个NC组人工时域脑电信号中各生成了200个新样本。
1.3 锁相值
本文基于锁相值(phase locking value,PLV)(以符号PLV表示)的相位—幅值耦合方法分析各个通道信号之间的相互调制作用关系[23]。假设2个不同的信号x(n)和y(n),则其对应的PLV如式(1)所示:
其中,,φy(n)为y(n)瞬时幅值序列的瞬时相位,φx(n)为x(n)的瞬时相位,N为信号x(n)和y(n)的序列长度,e代表自然常数,i代表虚数单位,符号“Σ”代表求和运算,|·|代表取绝对值运算。
1.4 批归一化层
BN层利用权重伸缩不变性原理有效地避免了反向传播时因为权重过大或过小导致的梯度消失或梯度爆炸问题,并加快神经网络梯度下降训练过程的收敛速度。把BN层作为神经网络的一部分,可以使每一层的输入具有相同且稳定的分布,并且BN层可以起到正则化的作用,来代替随机失活(dropout)层[24-25]。
为了加速神经网络模型的训练过程,提高其泛化性能,使其更加容易学习到数据之中的规律,本文在每一个卷积层和全连接层之后都加入了BN层。
1.5 优化的卷积神经网络结构
基于局部感受野及权重共享的理念,CNN可以有效地降低网络架构的复杂程度和权重参数数目,并且因为样本在原始特征空间上的值可以直接用来作为网络的输入层,CNN可以通过卷积核和前馈神经网络来对特征提取和分类的过程进行优化[26]。
本文设计的CNN主干结构如图1所示,由2个卷积层、2个最大池化层和2个全连接层组成,其中,卷积层采用整流线性单元(rectified linear unit,ReLU)作为激活函数,全连接层采用双曲正切函数作为激活函数[27]。
2 实验结果及分析
2.1 锁相值矩阵分析
MCI组和NC组的脑电信号在不同节律组合下,各通道间低频节律相位和高频节律幅值的PLV平均值矩阵如图2、图3所示,其中横轴和纵轴代表16导通道的编号,矩阵中的元素为指定两通道下PLV的样本均值。从全脑区域来看,NC组的PLV明显高于MCI组,特别是δ-θ、θ-α和α-β节律组合,区别更加明显。
六种节律组合下PLV平均值矩阵的数值分布箱形图如图4所示。结果显示,MCI组和NC组的PLV平均值矩阵,在六种节律组合下的数值分布均有明显不同,其中δ-θ节律组合下,MCI组和NC组PLV平均值矩阵的中位数分别为0.587 2和0.591 8,差值为0.004 6,是六种节律组合中的最大值。
为了更加直观地分析MCI组和NC组之间PLV的差异,本文设各样本PLV矩阵的矩阵均值为其全局相位同步指数,统计了MCI组与NC组在各节律组合下全局相位同步指数的平均值和标准差,并采用独立样本t检验方法比较MCI组与NC组样本间的差异,检验水准为0.05,比较结果如图5所示。
结果显示,在δ-θ节律组合下,MCI组和NC组的全局相位同步指数平均值的差异最为明显,其差值为0.005,且样本间差异具有统计学意义(P = 0.025,d = 0.398),故本文选取δ-θ节律组合下的PLV矩阵作为分类器输入特征。
2.2 基于优化卷积神经网络的诊断分类
本文采用10倍交叉验证的方式将数据集分成十份,轮流将其中9份作为训练集,1份作为测试集,对基于数据增强后的400个样本训练的模型进行了诊断性能验证。模型训练时采用的优化器为适应性矩估计(adaptive moment estimation,Adam),学习率设为0.001,每一次训练的批大小为60,训练轮次数为200。在基于δ-θ节律组合耦合特征的10倍交叉验证中,本文抽取其中一次完整训练过程,观察测试集损失值和准确率的表现,结果如图6所示。根据观察,测试集的准确率随着训练轮次的增加而上升,并在大约100轮左右趋于稳定,这说明模型在训练过程中逐渐学习到更准确的预测能力。同时,测试集的损失值随着训练轮次的增加而下降,并在大约60轮后下降幅度逐渐变小,这表明模型逐渐减小了预测误差,但可能存在一定的上限,无法进一步降低损失值。
为了验证本文提出的CNN模型和δ-θ节律组合下耦合特征的有效性,本文提取了δ-θ节律组合下各样本PLV矩阵的最大值、平均值、最大值低频通道编号和最大值高频通道编号,然后以此为特征训练采用高斯核函数(radial basis function kernel,RBF)的支持向量机(support vector machine,SVM)模型,并最终使用网格搜索法(grid search,GS)对SVM模型的惩罚系数C与RBF的系数γ进行优化得到局部最优解[28-29]。此外本文还采用优化后的CNN模型对另外五种节律组合下的耦合特征进行了训练,对比结果如表2所示。表2中,δ-θ表示基于δ-θ节律组合下的耦合特征训练模型,数据均以均值±标准差的形式展示。
由以上结果可以看出,本文采用的优化的CNN模型相较于传统的SVM模型在性能上有了较大提升,在除基于θ-β节律组合下耦合特征的训练结果外,基于其余五种节律组合下耦合特征的CNN模型分类准确率都达到了90%以上,证明其可以更好地完成对MCI患者的诊断任务,并且该CNN模型在δ-θ节律组合下的表现最为优异。
进一步,本文进行了不添加BN层的CNN模型训练实验,如图7所示,其为一轮训练中测试集损失值的表现,可以发现不添加BN层的CNN模型在相同学习率和训练轮次的条件下,发生了梯度消失现象,导致模型不能学习到特征信息,无法拟合出一个有效的分类函数,其证明了BN层对于缓解深层网络梯度消失的问题具有重要意义。
3 讨论与分析
CFC具有多种模式,例如相幅耦合、相位耦合和幅值耦合等[30-31]。其中,相幅耦合中的低频与高频之间的耦合已被深入地研究,并已证明与认知任务中神经元之间的信息交流整合有关[6, 32-33]。Kendrick等[34]在动物实验的研究中发现,随着学习任务的增加,θ-γ节律组合的相位—幅值耦合强度增加,并且这种变化与辨别行为能力呈现相关性。Friese等[35]发现﹐人类短时记忆编码的成功与额叶低频θ和枕叶高频γ的相位—幅值耦合相关,形成一段新记忆的同时,θ-γ节律组合的相位—幅值耦合强度也在增加。这些研究结果表明了低频和高频之间的相位—幅值耦合与学习任务、辨别行为和短时记忆编码有关,但目前的研究大多集中于对γ节律进行探讨,本文以PLV方法分析了除γ节律外其余六种低频与高频节律组合下,脑电样本中各通道间的耦合强度。
结果表明,MCI组和NC组在六种节律组合下各通道间的耦合强度都有明显区别,从全脑区域来看,MCI组通道间的耦合强度相较于NC组明显降低,且在δ-θ节律组合下的耦合强度特征差异具有统计学意义,故本文以δ-θ节律组合下的PLV矩阵作为本文所提出优化模型的输入特征,验证该耦合特征是否可以作为临床诊断的辅助工具。分类结果显示,优化后的CNN模型相较于传统的机器学习模型,在性能上有了较大的提升,并且模型在基于δ-θ节律组合下的耦合特征训练时,分类性能最为优异。
由于医疗信息系统杂乱分散,数据聚合性差,导致临床脑电数据的获取难度较大,难以在另一个数据集上进行交叉验证,本文基于现有的数据集使用10倍交叉验证的方式来评估模型的泛化能力,验证了模型的可靠性。观察表1的数据可以发现,MCI组和NC组在男女比例特征、年龄特征与受教育年限特征中,两组间差异无统计学意义,证明采集的数据具有代表性,不会受这些因素所影响。除此之外,本研究还对受试者进行了ADL、MoCA和MMSE三项认知测试,但未考虑认知测试得分对MCI诊断的影响,之后的研究中会将这三种认知测试的得分作为控制变量来进一步验证MCI组与NC组低频相位与高频幅值间的耦合特征差异。
4 结论
本文分析了MCI组和NC组脑电数据在六种低高频节律组合下各通道间的PLV矩阵差异。结果表明,MCI组和NC组在δ-θ节律组合下全局相位同步指数的差异具有统计学意义(P = 0.025,d = 0.398),δ-θ节律组合下的耦合特征是可以辅助MCI患者早期诊断的有意义特征。除此之外,本文提出了一种优化的CNN模型,模型采用时频数据增强技术来避免训练时出现过拟合问题的同时,通过添加BN层提高了CNN模型的性能。最终,本文通过基于δ-θ节律组合下的耦合特征训练优化后CNN模型的方式,验证了所提出的模型和δ-θ节律组合下耦合特征的有效性,结果显示其分类准确度达(95.49 ± 4.15)%,相较于传统的分类模型和其它节律组合下的耦合特征,其能更好地完成对MCI患者的诊断识别任务。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:所有作者都参与了本研究的构思和设计。基础理论研究、编写模型代码由王凯完成,论文初稿的撰写由王凯和景军完成,数据收集和分析由尹立勇完成,李昕完成了文章的审阅及校对,张莹和谢平对数据的提取处理提供了指导意见。所有作者都阅读并批准了最终稿件。
伦理声明:本研究通过了河北省人民医院伦理审查委员会的审批(批文编号:UY202201)。
0 引言
轻度认知障碍(mild cognitive impairment,MCI)是阿尔兹海默病病程发展的关键阶段,挖掘MCI诊断标记特征,以较小的特征代价实现早期诊断具有临床研究意义[1-4]。现有研究表明,不同脑区之间的信息交流是以神经振荡节律之间有序的神经编码机制完成的,交叉频率耦合(cross-frequency coupling,CFC)作为不同节律局部和整体之间相互作用的载体机制,与分布式的信息整合有直接的联系[5-7]。尤其对于患有认知障碍的人群,由于大脑神经细胞发生病变,导致大脑的功能连接受损,其静息态脑电信号常表现出快振荡减弱、慢振荡增强的现象[8]。
大脑节律间的耦合特征与多重认知和行为相关[9-10]。Schack等[11]通过对实验数据进行双谱分析,发现当大脑处于感知和记忆任务当中时,θ节律的相位可以调制γ节律的幅值,即存在相幅耦合现象。Palva等[12]通过分析受试者在连续心算任务中的脑磁图(magnetoencephalography,MEG)发现,大脑皮层中存在明显的跨频相位耦合现象,且γ节律和α节律的相位耦合强度随着任务难度上升而增强。Yanagisawa等[13]分析感觉运动皮层的脑电数据时,发现α节律与γ节律、β节律与γ节律的相幅耦合强度会随着受试者感知和认知状态的改变而改变。
认知水平下降会导致神经振荡耦合特征异常,如Ahnaou等[14]在阿尔兹海默病小鼠模型中发现了阿尔兹海默病小鼠脑电数据中的θ振荡和相干活动减弱,并且θ-γ振荡的相幅耦合强度明显降低。闫彦等[15]使用非线性相互依赖性的方法观察脑电数据在相同节律下通道间的耦合强度,发现MCI患者(MCI组)脑电数据的θ节律和α节律在不同通道间耦合强度的平均值低于正常人[正常对照(normal controls,NC)组],且其差异具有统计学意义。Liu等[16]在同一节律下不同通道间,采用互信息(mutual information,MI)分析方法量化与任务相关的脑电信号的耦合强度,发现NC组与MCI组的θ节律耦合强度区别明显。
本文基于多层次的相位—幅值耦合方法分析脑电数据,研究MCI组和NC组在不同节律组合下,各通道低频节律相位与高频节律幅值之间的耦合关系。为了进一步挖掘认知下降初期的特征标记,本文以δ-θ节律相幅耦合特征为单一特征,采用批归一化(batch normalization,BN)层优化的卷积神经网络(convolutional neural networks,CNN)模型实现对MCI患者的自动诊断[17]。针对临床数据的小样本问题,本文采用时频数据增强技术,实现样本扩充[18-19]。基于此优化模型,本文验证了所提出的特征作为区分MCI患者和正常人的生物标志的可行性,期望为MCI患者的临床诊断提供理论依据。
1 方法
1.1 数据采集与预处理
本文采用的数据样本来自河北省人民医院,共招募49名受试者参与本研究,其中MCI患者入组28人,平均年龄为(65.2 ± 5.4)岁;NC组21人,平均年龄为(67.1 ± 6.3)岁,均身体健康,没有相关的神经性病症,大脑功能状态正常;所有受试者均自愿参与本文研究并签署了知情同意书。所有受试者均通过磁共振成像(magnetic resonance imaging,MRI)或者计算机断层扫描检查,排除了脑部局灶性病变,并接受了视觉、听觉测试,以及认知测试。其中,认知测试包括简易精神状态检查(mini-mental state examination,MMSE)、蒙特利尔认知评估量表(Montreal cognitive assessment,MoCA)和日常生活活动量表(activities of daily living,ADL)[20]。受试者基本信息如表1所示,数据以均值 ± 标准差显示,并采用独立样本t检验方法比较了MCI组与NC组样本间的差异,检验水准为0.05。
本文试验依据《世界医学协会赫尔辛基宣言》进行,通过了河北省人民医院伦理审查委员会的批准(批文编号:UY202201)。
本文脑电信号采集采用16导通道数字脑电图仪(NT9200,北京中科新拓仪器有限公司,中国)完成,其电极位置符合国际标准10/20系统的规格,采样率为1 024 Hz。采集数据时,受试者均处于清醒、无干扰的状态,试验人员记录受试者在闭眼放松状态下5 min的脑电信号。
本文采用科学计算软件Matlab(2017a,MathWorks,美国)的EEGLAB工具箱基于独立成分分析(independent components analysis,ICA),完成剔除眼电、心电、肌电等干扰信号的预处理工作[21]。为了使每个样本的脑电信号长度相等,本文将所采集的脑电信号进行分段截取,截取位置为采集开始后的32~64 s,共计32 768个数据点。最终,采用带通滤波进行节律分解。
1.2 时频数据增强
针对个体性差异问题,在保持脑电信号原有特性的情况下,本文从时域和频域上实现了数据增强[22]。数据增强步骤如下:
(1)信号分割:将原始脑电信号数据在时域上分割,每段长度为8 192个数据点。
(2)时域重组:随机选择四段脑电信号重新组合,生成人工时域脑电信号。本文共生成400个人工时域脑电信号,其中MCI组与NC组各200个。
(3)频域交换:将人工时域脑电信号进行快速傅里叶变换﹐然后对相同类别脑电信号的同一频段进行随机交换,重新组合成人工时频脑电信号。人工时频脑电信号就是经过数据增强后得到的新样本。本文从200个MCI组人工时域脑电信号和200个NC组人工时域脑电信号中各生成了200个新样本。
1.3 锁相值
本文基于锁相值(phase locking value,PLV)(以符号PLV表示)的相位—幅值耦合方法分析各个通道信号之间的相互调制作用关系[23]。假设2个不同的信号x(n)和y(n),则其对应的PLV如式(1)所示:
其中,,φy(n)为y(n)瞬时幅值序列的瞬时相位,φx(n)为x(n)的瞬时相位,N为信号x(n)和y(n)的序列长度,e代表自然常数,i代表虚数单位,符号“Σ”代表求和运算,|·|代表取绝对值运算。
1.4 批归一化层
BN层利用权重伸缩不变性原理有效地避免了反向传播时因为权重过大或过小导致的梯度消失或梯度爆炸问题,并加快神经网络梯度下降训练过程的收敛速度。把BN层作为神经网络的一部分,可以使每一层的输入具有相同且稳定的分布,并且BN层可以起到正则化的作用,来代替随机失活(dropout)层[24-25]。
为了加速神经网络模型的训练过程,提高其泛化性能,使其更加容易学习到数据之中的规律,本文在每一个卷积层和全连接层之后都加入了BN层。
1.5 优化的卷积神经网络结构
基于局部感受野及权重共享的理念,CNN可以有效地降低网络架构的复杂程度和权重参数数目,并且因为样本在原始特征空间上的值可以直接用来作为网络的输入层,CNN可以通过卷积核和前馈神经网络来对特征提取和分类的过程进行优化[26]。
本文设计的CNN主干结构如图1所示,由2个卷积层、2个最大池化层和2个全连接层组成,其中,卷积层采用整流线性单元(rectified linear unit,ReLU)作为激活函数,全连接层采用双曲正切函数作为激活函数[27]。
2 实验结果及分析
2.1 锁相值矩阵分析
MCI组和NC组的脑电信号在不同节律组合下,各通道间低频节律相位和高频节律幅值的PLV平均值矩阵如图2、图3所示,其中横轴和纵轴代表16导通道的编号,矩阵中的元素为指定两通道下PLV的样本均值。从全脑区域来看,NC组的PLV明显高于MCI组,特别是δ-θ、θ-α和α-β节律组合,区别更加明显。
六种节律组合下PLV平均值矩阵的数值分布箱形图如图4所示。结果显示,MCI组和NC组的PLV平均值矩阵,在六种节律组合下的数值分布均有明显不同,其中δ-θ节律组合下,MCI组和NC组PLV平均值矩阵的中位数分别为0.587 2和0.591 8,差值为0.004 6,是六种节律组合中的最大值。
为了更加直观地分析MCI组和NC组之间PLV的差异,本文设各样本PLV矩阵的矩阵均值为其全局相位同步指数,统计了MCI组与NC组在各节律组合下全局相位同步指数的平均值和标准差,并采用独立样本t检验方法比较MCI组与NC组样本间的差异,检验水准为0.05,比较结果如图5所示。
结果显示,在δ-θ节律组合下,MCI组和NC组的全局相位同步指数平均值的差异最为明显,其差值为0.005,且样本间差异具有统计学意义(P = 0.025,d = 0.398),故本文选取δ-θ节律组合下的PLV矩阵作为分类器输入特征。
2.2 基于优化卷积神经网络的诊断分类
本文采用10倍交叉验证的方式将数据集分成十份,轮流将其中9份作为训练集,1份作为测试集,对基于数据增强后的400个样本训练的模型进行了诊断性能验证。模型训练时采用的优化器为适应性矩估计(adaptive moment estimation,Adam),学习率设为0.001,每一次训练的批大小为60,训练轮次数为200。在基于δ-θ节律组合耦合特征的10倍交叉验证中,本文抽取其中一次完整训练过程,观察测试集损失值和准确率的表现,结果如图6所示。根据观察,测试集的准确率随着训练轮次的增加而上升,并在大约100轮左右趋于稳定,这说明模型在训练过程中逐渐学习到更准确的预测能力。同时,测试集的损失值随着训练轮次的增加而下降,并在大约60轮后下降幅度逐渐变小,这表明模型逐渐减小了预测误差,但可能存在一定的上限,无法进一步降低损失值。
为了验证本文提出的CNN模型和δ-θ节律组合下耦合特征的有效性,本文提取了δ-θ节律组合下各样本PLV矩阵的最大值、平均值、最大值低频通道编号和最大值高频通道编号,然后以此为特征训练采用高斯核函数(radial basis function kernel,RBF)的支持向量机(support vector machine,SVM)模型,并最终使用网格搜索法(grid search,GS)对SVM模型的惩罚系数C与RBF的系数γ进行优化得到局部最优解[28-29]。此外本文还采用优化后的CNN模型对另外五种节律组合下的耦合特征进行了训练,对比结果如表2所示。表2中,δ-θ表示基于δ-θ节律组合下的耦合特征训练模型,数据均以均值±标准差的形式展示。
由以上结果可以看出,本文采用的优化的CNN模型相较于传统的SVM模型在性能上有了较大提升,在除基于θ-β节律组合下耦合特征的训练结果外,基于其余五种节律组合下耦合特征的CNN模型分类准确率都达到了90%以上,证明其可以更好地完成对MCI患者的诊断任务,并且该CNN模型在δ-θ节律组合下的表现最为优异。
进一步,本文进行了不添加BN层的CNN模型训练实验,如图7所示,其为一轮训练中测试集损失值的表现,可以发现不添加BN层的CNN模型在相同学习率和训练轮次的条件下,发生了梯度消失现象,导致模型不能学习到特征信息,无法拟合出一个有效的分类函数,其证明了BN层对于缓解深层网络梯度消失的问题具有重要意义。
3 讨论与分析
CFC具有多种模式,例如相幅耦合、相位耦合和幅值耦合等[30-31]。其中,相幅耦合中的低频与高频之间的耦合已被深入地研究,并已证明与认知任务中神经元之间的信息交流整合有关[6, 32-33]。Kendrick等[34]在动物实验的研究中发现,随着学习任务的增加,θ-γ节律组合的相位—幅值耦合强度增加,并且这种变化与辨别行为能力呈现相关性。Friese等[35]发现﹐人类短时记忆编码的成功与额叶低频θ和枕叶高频γ的相位—幅值耦合相关,形成一段新记忆的同时,θ-γ节律组合的相位—幅值耦合强度也在增加。这些研究结果表明了低频和高频之间的相位—幅值耦合与学习任务、辨别行为和短时记忆编码有关,但目前的研究大多集中于对γ节律进行探讨,本文以PLV方法分析了除γ节律外其余六种低频与高频节律组合下,脑电样本中各通道间的耦合强度。
结果表明,MCI组和NC组在六种节律组合下各通道间的耦合强度都有明显区别,从全脑区域来看,MCI组通道间的耦合强度相较于NC组明显降低,且在δ-θ节律组合下的耦合强度特征差异具有统计学意义,故本文以δ-θ节律组合下的PLV矩阵作为本文所提出优化模型的输入特征,验证该耦合特征是否可以作为临床诊断的辅助工具。分类结果显示,优化后的CNN模型相较于传统的机器学习模型,在性能上有了较大的提升,并且模型在基于δ-θ节律组合下的耦合特征训练时,分类性能最为优异。
由于医疗信息系统杂乱分散,数据聚合性差,导致临床脑电数据的获取难度较大,难以在另一个数据集上进行交叉验证,本文基于现有的数据集使用10倍交叉验证的方式来评估模型的泛化能力,验证了模型的可靠性。观察表1的数据可以发现,MCI组和NC组在男女比例特征、年龄特征与受教育年限特征中,两组间差异无统计学意义,证明采集的数据具有代表性,不会受这些因素所影响。除此之外,本研究还对受试者进行了ADL、MoCA和MMSE三项认知测试,但未考虑认知测试得分对MCI诊断的影响,之后的研究中会将这三种认知测试的得分作为控制变量来进一步验证MCI组与NC组低频相位与高频幅值间的耦合特征差异。
4 结论
本文分析了MCI组和NC组脑电数据在六种低高频节律组合下各通道间的PLV矩阵差异。结果表明,MCI组和NC组在δ-θ节律组合下全局相位同步指数的差异具有统计学意义(P = 0.025,d = 0.398),δ-θ节律组合下的耦合特征是可以辅助MCI患者早期诊断的有意义特征。除此之外,本文提出了一种优化的CNN模型,模型采用时频数据增强技术来避免训练时出现过拟合问题的同时,通过添加BN层提高了CNN模型的性能。最终,本文通过基于δ-θ节律组合下的耦合特征训练优化后CNN模型的方式,验证了所提出的模型和δ-θ节律组合下耦合特征的有效性,结果显示其分类准确度达(95.49 ± 4.15)%,相较于传统的分类模型和其它节律组合下的耦合特征,其能更好地完成对MCI患者的诊断识别任务。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:所有作者都参与了本研究的构思和设计。基础理论研究、编写模型代码由王凯完成,论文初稿的撰写由王凯和景军完成,数据收集和分析由尹立勇完成,李昕完成了文章的审阅及校对,张莹和谢平对数据的提取处理提供了指导意见。所有作者都阅读并批准了最终稿件。
伦理声明:本研究通过了河北省人民医院伦理审查委员会的审批(批文编号:UY202201)。