基于表面肌电信号能量核相图的卷积神经网络人体手势识别算法_《生物医学工程学杂志》

作者：

许留凯 ^1,2 , 张克勤 ³ , 徐兆红 ³ ,  杨根科 ^1,2

1. 上海交通大学宁波人工智能研究院（浙江宁波 315000）;
2. 上海交通大学自动化系（上海 200240）;
3. 宁波工业互联网研究院（浙江宁波 315000）;

关键词：

表面肌电信号手势识别能量核卷积神经网络

DOI：

10.7507/1001-5515.202010080

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

表面肌电信号（sEMG）是一种不平稳非周期的微弱信号，基于时域和频域特征提取的 sEMG 信号分类方法识别率低、稳定性差。本文通过对 sEMG 信号能量核特征的建模分析，提出一种利用卷积神经网络（CNN）对 sEMG 信号能量核相图进行分类的新架构，来对人体手势动作进行识别。首先，利用矩阵计数方法将 sEMG 信号能量核相图处理为灰度图像；其次，利用移动平均对灰度图进行预处理；最后，采用 CNN 对手势 sEMG 信号进行识别。利用手势 sEMG 信号数据集进行了实验验证，结果表明选用 CNN 识别框架的有效性以及 CNN 结合能量核相图的识别方法相比于能量核面积提取方法，在识别精度和计算效率上具有明显的优势。本文算法为 sEMG 信号的建模分析与实时识别问题提供了新的可行方法。

引用本文： 许留凯, 张克勤, 徐兆红, 杨根科. 基于表面肌电信号能量核相图的卷积神经网络人体手势识别算法. 生物医学工程学杂志, 2021, 38(4): 621-629. doi: 10.7507/1001-5515.202010080 复制

引言

随着人口老龄化现象的加剧，老年运动障碍患者也急速增多，辅助康复以及助力助行外骨骼机器人的需求增大。外骨骼机器人是模仿生物界外骨骼而提出的一种新型机电一体化装置，结合传感、控制、信息融合、移动计算等技术，不仅可为穿戴者提供支撑与保护，还能辅助人体完成适度动作，执行特定任务等^[1]。通过获取表面肌电信号（surface electromyography，sEMG）并进一步识别穿戴者的运动意图是实现外骨骼机器人辅助运动功能的重要基础，是人机交互研究热点问题^[2]。当前 sEMG 信号采集技术成熟，蕴含信息丰富，且可以在体表对活动肌肉进行无创检测，现已广泛使用^[1]。基于 sEMG 信号的意图识别主要包含 sEMG 信号特征提取与分类器设计两大问题。常用的 sEMG 信号特征包括时域、频域和时频分析三大类^[3]。时域与频域特征虽然计算方便，但是 sEMG 信号的不平稳性导致这些特征稳定性较差^[4],时频特征分析虽然稳定性较好，但是其计算复杂，无法满足运动意图识别对实时性的要求^[5]。

由于时域、频域等特征在 sEMG 信号特征识别中存在不稳定性，一些学者开始对肌肉生物机制建模分析。Chen 等^[5]提出了能量核方法来估计肌肉收缩力及肌肉的一些固有特征，并通过实验证明该特征的鲁棒性和较强的泛化能力。对于 sEMG 信号能量核特征的研究，主要集中在如何更高效地计算能量核相图椭圆分布面积的方法上，Chen 等^[5]提出的线性围栏法（linear fencing，LF）利用倾角变化的直线去拟合椭圆边界，并以此计算面积，但是该方法计算效率较低，无法满足实时性的要求。为此，Chen 等^[6]又提出了离散盒矩阵计数法（discrete box counting，DBC），利用矩阵覆盖散点并设定阈值计数的方法来计算椭圆面积，计算效率显著提高。Zeng 等^[7]通过改进 LF 法，只用四条相互垂直的直线来确定椭圆边界，可实现与文献[6]相近的识别准确率，且椭圆面积的计算更方便。石欣等^[8]对 DBC 进行了改进，提出了阈值矩阵计数法（threshold matrix count，TMC）设定两个阈值来计数，相比于 DBC 考虑了椭圆边界处的分散点。上述方法都是手动计算能量核椭圆面积，缺乏统一的参数标准，还会遗漏能量核相图的其它特征，或者对特征的提取不够充分。

在分类器设计上，人工神经网络（artificial neural network，ANN）是一种模仿生物神经网络的数学模型，广泛应用在图像处理、语音识别等领域^[9-10]。针对手动提取 sEMG 信号特征带来的不足，自然引入 ANN 进行训练与学习，其中卷积神经网络（convolutional neural network，CNN）、多层感知器（multilayer perceptron，MLP）、循环神经网络（recurrent neural network，RNN）和长短期记忆网络（long short-term memory，LSTM）应用较为广泛^[11-17]。Atzori 等^[12]将一段时间窗覆盖的多通道 sEMG 信号幅值形成的二维矩阵作为 CNN 输入，通过设置时间窗的大小与移动步长来提取 sEMG 信号的幅值特征，利用 CNN 对幅值矩阵进行特征提取与分类。Geng 等^[13]利用 8×16 高密度肌电阵列采集手臂 sEMG 信号，将瞬时 sEMG 信号的幅值当作矩阵每个元素值，以此形成 sEMG 信号幅值阵列图像作为 CNN 网络输入。Wei 等^[14]利用多流 CNN 对高密度 sEMG 信号瞬时幅值图进行训练，将多通道 sEMG 信号幅值图分别输入多个 CNN，后将多流 CNN 学习到的特征进行融合并识别分类。相比于高密度肌电图，Zhai 等^[15]对稀疏多通道的 sEMG 信号进行快速傅里叶变换（fast Fourier transform，FFT），获得 sEMG 信号频谱图像来进行 CNN 训练，利用 CNN 进一步提取频谱特征信息并识别。He 等^[16]分别利用 MLP 与 LSTM 对 sEMG 信号时序及幅值矩阵进行特征提取，再将网络学习到的特征融合为新的特征向量进行分类识别。Wu 等^[17]利用 LSTM 网络对 sEMG 信号提取时序特征，后利用 CNN 对 LSTM 的输出特征进行二次特征提取与识别。上述网络大多采用 sEMG 信号原始时序数据或频域信息作为网络输入，但是由于 sEMG 信号时域、频域特征的不稳定性可能会导致运动意图识别的稳定性下降^[4]。

本文提出一种 sEMG 信号能量核模型的识别框架，该框架通过引入 CNN，对能量核相图进行网络学习与特征提取。新框架在处理能量核相图中，省去计算面积的步骤，直接对能量核相图进行网络自动学习与训练，这相比单纯提取能量核相图的椭圆面积可学习到更全面的特征且速度也更快，同时以能量核相图作为网络输入也避免了 sEMG 信号时域、频域特征不稳定所带来的局限。本研究进一步利用公开的多通道手势 sEMG 数据集进行手势识别实验，以验证本文所提识别框架的有效性和实用性。本文提出的识别算法为人体 sEMG 信号的建模分析提供了新的思路，或可为基于人体生物学的人机交互研究带来新的启发。

1 sEMG 信号能量核模型

1.1 数据集来源

本文所有实验数据来自非侵入自适应假肢肌电 2 号数据集（non-invasive adaptive prosthetics database 2，NinaPro DB2）（网址：http://datadryad.org/stash/dataset/doi:10.5061/dryad.1k84r），该数据集已经公开，可用于科学研究。NinaPro DB2 数据集制作时使用 sEMG 信号采集设备 Delsys（Trigno，Delsys Inc.，美国），采样频率是 2 000 Hz，共使用 12 个电极采集健康受试者手势动作 sEMG 信号，要求受试者每个动作重复 6 次，每两次动作间隔 3 s，共采集 49 种手势动作，动作主要包含抓握物体、多类手指动作、手腕翻转等。

1.2 sEMG 信号能量核相图

区别于 sEMG 信号时域、频域和时频分析等特征，能量核模型是建立在对 sEMG 信号建模基础之上的新方法。sEMG 信号可以看作是均值为零的统计时序信号，其信号幅值具有往复运动的特征^[18]，这种运动可以描述为振子模型 ^[5-8]，利用振子模型可将其表示为微分方程^[19]。将 sEMG 信号的幅值作为横坐标，幅值对时间的导数作为纵坐标，在平面直角坐标系下可以将一段 sEMG 信号绘制成一幅相图。如图 1 所示为一段两通道手势 sEMG 信号与对应能量核相图，两通道 sEMG 信号中蓝色线条表示通道 1 信号，橙色曲线表示通道 2 信号，将绿色虚线框包围的 sEMG 数据（400 采样点）坐标化处理，绘制成能量核相图，相图中蓝色点与橙色点分别是通道 1 和通道 2 信号对应相图散点分布，虚线表示对应相图散点的分布边界。这些相图散点在坐标平面近似呈椭圆分布^[5-8]，Zeng 等^[7]利用 LF 法对椭圆边界进行了定位，经过多次实验得出了椭圆长轴在大部分时间与横坐标轴垂直或平行，只有少数采样点偏离坐标轴的结论。

图1 两通道 sEMG 信号与对应能量核相图 Figure1. Two-channel sEMG signal and corresponding energy kernel phase portrait

图选项

手势类别数		平均识别精度	平均识别时间/ms
100 ms 时间窗	2	98.46%	0.34
	4	93.10%	0.26
	8	93.16%	0.26
	16	80.32%	0.67
200 ms 时间窗	2	96.92%	0.28
	4	93.96%	0.22
	8	94.44%	0.24
	16	85.12%	0.29

1.	丁其川, 熊安斌, 赵新刚, 等. 基于表面肌电的运动意图识别方法研究及应用综述. 自动化学报, 2016, 42(1): 13-25.
2.	Meng Qingyun, Meng Qiaoling, Yu Hongliu, et al. A survey on sEMG control strategies of wearable hand exoskeleton for rehabilitation//2017 2nd Asia-Pacific Conference on Intelligent Robot Systems (ACIRS), Wuhan: IEEE, 2017: 165-169.
3.	Phukpattaranont P, Thongpanja S, Anam K, et al. Evaluation of feature extraction techniques and classifiers for finger movement recognition using surface electromyography signal. Med Biol Eng Comput, 2018, 56(12): 2259-2271.
4.	丁帅, 王亮. 基于块稀疏贝叶斯学习的肌电信号特征提取. 仪器仪表学报, 2014, 35(12): 2731-2738.
5.	Chen X, Yin Y, Fan Y. EMG oscillator model-based energy kernel method for haracterizing muscle intrinsic property under isometric contraction. Chin Sci Bull, 2014, 59(14): 1556-1567.
6.	Chen X, Zeng Y, Yin Y. Improving the transparency of an exoskeleton knee joint based on the understanding of motor intent using energy kernel method of EMG. IEEE Trans Neural Syst Rehabil Eng, 2017, 25(6): 577-588.
7.	Zeng Y, Yang J, Peng C, et al. Evolving gaussian process autoregression based learning of human motion intent using improved energy kernel method of EMG. IEEE Trans Biomed Eng, 2019, 66(9): 2556-2565.
8.	石欣, 朱家庆, 秦鹏杰, 等. 基于改进能量核的下肢表面肌电信号特征提取方法. 仪器仪表学报, 2020, 41(1): 121-128.
9.	Yang Kuo, Zhang Zhen. Real-time pattern recognition for hand gesture based on ANN and surface EMG//2019 IEEE 8th Joint International Information Technology and Artificial Intelligence Conference (ITAIC), Chongqing: IEEE, 2019: 799-802.
10.	Abdel-Hamid O, Mohamed A, Jiang H, et al. Convolutional neural networks for speech recognition. IEEE/ACM Trans Audio, Speech, Language Process, 2014, 22(10): 1533-1545.
11.	Pinzón-Arenas J O, Jiménez-Moreno R, Herrera-Benavides J E. Convolutional neural network for hand gesture recognition using 8 different EMG signals//2019 XXII Symposium on Image, Signal Processing and Artificial Vision (STSIVA). Bucaramanga: IEEE, 2019: 1-5.
12.	Atzori M, Cognolato M, Müller H. Deep learning with convolutional neural networks applied to electromyography data: a resource for the classification of movements for prosthetic hands. Front Neurorobot, 2016, 10: 9.
13.	Geng W, Du Y, Jin W, et al. Gesture recognition by instantaneous surface EMG images. Sci Rep, 2016, 6: 36571.
14.	Wei W, Wong Y, Du Y, et al. A multi-stream convolutional neural network for sEMG-based gesture recognition in muscle-computer interface. Pattern Recognit Lett, 2019, 119: 131-138.
15.	Zhai X, Jelfs B, Chan R M, et al. Self-recalibrating surface EMG pattern recognition for neuroprosthesis control based on convolutional neural network. Front Neurosci, 2017, 11: 379.
16.	He Yunan, Fukuda O, Bu Nan, et al. Surface EMG pattern recognition using long short-term memory combined with multilayer perceptron//2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), Honolulu: IEEE, 2018: 5636-5639.
17.	Wu Yuheng, Zheng Bin, Zhao Yongting. Dynamic gesture recognition based on LSTM-CNN//2018 Chinese Automation Congress (CAC), Xi’an: IEEE, 2018: 2446-2450.
18.	Staudenmann D, Roeleveld K, Stegeman D F, et al. Methodological aspects of SEMG recordings for force estimation--a tutorial and review. J Electromyogr Kinesiol, 2010, 20(3): 375-387.
19.	Du Y C, Lin C H, Shyu L Y, et al. Portable hand motion classifier for multi-channel surface electromyography recognition using grey relational analysis. Expert Syst Appl, 2010, 37(6): 4283-4291.
20.	McComas A J, Mrozek K. The electrical properties of muscle fiber membranes in dystrophia myotonica and myotonia congenita. J Neurol Neurosurg Psychiatry, 1968, 31(5): 441-447.
21.	Trajano G S, Nosaka K, Blazevich A J. Neurophysiological mechanisms underpinning stretch-induced force loss. Sports Med, 2017, 47(8): 1531-1541.
22.	李伟, 杨向东, 陈恳. 基于CNN和RNN联合网络的心音自动分类. 计算机工程与设计, 2020, 41(1): 46-51.
23.	Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks. Commun ACM, 2017, 60(6): 84-90.

《生物医学工程学杂志》

基于表面肌电信号能量核相图的卷积神经网络人体手势识别算法

摘要 全文 图表 视频 参考文献 施引文献 补充材料

引言

1 sEMG 信号能量核模型

1.1 数据集来源

1.2 sEMG 信号能量核相图

1.3 sEMG 信号能量核振子模型

2 基于 sEMG 信号能量核相图的 CNN 识别算法

2.1 sEMG 信号能量核相图图像构造

2.2 CNN 识别 sEMG 信号能量核相图算法

3 实验与结果分析

3.1 实验配置与测试结果

3.2 对比实验与效果分析

3.2.1 多通道时间窗 sEMG 信号与能量核相图对比实验

3.2.2 CNN 与经典分类器识别能量核相图对比实验

3.2.3 CNN 与典型神经网络分类器识别能量核相图对比实验

3.2.4 能量核面积特征识别与 CNN 识别能量核相图对比实验

4 结语

引言

1 sEMG 信号能量核模型

1.1 数据集来源

1.2 sEMG 信号能量核相图

1.3 sEMG 信号能量核振子模型

2 基于 sEMG 信号能量核相图的 CNN 识别算法

2.1 sEMG 信号能量核相图图像构造

2.2 CNN 识别 sEMG 信号能量核相图算法

3 实验与结果分析

3.1 实验配置与测试结果

3.2 对比实验与效果分析

3.2.1 多通道时间窗 sEMG 信号与能量核相图对比实验

3.2.2 CNN 与经典分类器识别能量核相图对比实验

3.2.3 CNN 与典型神经网络分类器识别能量核相图对比实验

3.2.4 能量核面积特征识别与 CNN 识别能量核相图对比实验

4 结语

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料