多模式人手动作分类识别方法

都明宇 王志恒 荀 一 鲍官军 高 峰 杨庆华 张立彬

浙江工业大学机械工程学院,杭州,310014

摘要:为了满足手部运动功能康复器的主动康复训练对多种人手动作模式识别的需求,分析了表面肌电信号采样通道设置布局、训练样本制作、特征提取方式、模式分类器结构参数等因素对手部动作识别的影响,设计了针对前臂的表面肌电信号采集方案,分别基于时域统计量、自回归模型系数、小波包分解系数特征设计了BP神经网络分类器。实验结果表明:对6种单指动作、13种多指动作、20种手部动作的最佳平均识别率分别为98.5%、92.4%、90.9%,计算时间小于190 ms,验证了所提出方法的有效性和实用性。

关键词表面肌电;手部动作;神经网络;模式识别

0 引言

中风引发的肢体偏瘫给病人及其家庭造成沉重的经济负担和精神压力。临床实践表明,运动功能的经常性训练,尤其是配合人体动作意图的主动训练对受损神经系统的功能恢复具有非常积极的作用[1-4],其中,手部动作对大脑皮层和肢体感觉的神经刺激作用最大[5]。表面肌电(surface electromyography,sEMG)信号是肌肉收缩过程中,大量运动单位动作电位(motor unit action potential,MUAP)经肌肉、皮下组织和皮肤的传导叠加,最终反映在皮肤表面的综合电效应[6],蕴含了丰富的生理神经信息,是非常理想的自主控制信息源。因此解码sEMG信号,实现对手部动作意图的识别,是基于sEMG信号控制的康复器或仿生义肢推广应用的前提。

基于sEMG信号的手部功能康复研究的焦点是准确判断sEMG信号与手部动作模式的对应关系。目前的手部动作识别研究中,较常用的方法是先对采集于前臂的sEMG信号进行特征提取并组成特征向量;再利用这些标记了动作类别属性的特征向量,训练基于不同算法的模式分类器;最终将离线训练和测试环节中分类性能突出、泛化能力强的分类器方案固化,并应用到在线动作模式分类任务。尽管基于sEMG信号的手部动作模式识别研究已取得了显著的成果,但目前能够被稳定识别的手部动作数量和种类仍然有限,大多数研究报道的识别种类都少于10种,且随着动作模式的增多,整体识别成功率下降明显[7]。因此深入开展面向多类手部动作模式的识别研究,有利于拓展精细动作识别能力,极具现实意义和应用价值。

1 多通道sEMG信号采集系统设计

1.1 信号采集

sEMG传感器电极的配置位置和数量对手部动作模式识别的影响十分显著[8]。信号量充足且信噪比高的sEMG信号是顺利完成手部动作多模式识别的前提。为了保证在提取足够信号的同时摒弃低效采样通道,本文对5位受试实验人员的前臂进行了三维扫描建模,通过3D打印技术制作了用于安装sEMG采样电极的阵列板臂套,如图1所示。该臂套能够有效提高多轮次采样环境下的电极重复定位精度。如图2所示,通过计算采样数据的信噪比并排序,本文确定了对识别率贡献度最高的5个信号采集点。信号采集使用的sEMG采集仪内置低通滤波器,具有10位的A/D转换精度,采样频率500 Hz,通过USB接口与工作站通信,可以同时采集12路sEMG信号并实时显示在工作站软件界面。采样电极为常规的3极式差分输入,可以最大程度地减小采样环节引入的共模干扰,保证采样信号的真实完整。

图1 sEMG采样系统
Fig.1 The sEMG sampling system

图2 采样电极布置方案
Fig.2 Sampling electrode layout plan

1.2 采样过程中的动作规范

为了保证手部动作的规范一致,5位受试实验人员都经过一定时间的练习。每种动作都以“放松-动作-放松”的形式循环进行,动作和放松时间都是1~2 s,每组测试持续1 min,组间休息时间不小于3 min。图3所示为“握拳”时5个通道的原始sEMG信号。

图3 原始表面肌电信号
Fig.3 Original sEMG signal

2 sEMG信号特征参数提取

分析表面肌电信号的方法主要有时域分析法、频域分析法、参数模型法、时频分析法、非线性动力学分析法等[7-9]。基于实时性要求,本文提取具有代表性的时域特征、自回归模型系数特征和小波包分解系数特征进行实验比对分析。在提取特征之前,采用滑动窗口法对原始sEMG信号的数据流进行分割预处理,滑动窗宽为64个采样点,增量为32采样点。

2.1 基于时域统计量的特征提取

时域特征提取简单快捷,在sEMG信号处理中被广泛应用。由于方差V、绝对均值M和均方根R可以分别表征信号的偏离程度、平均强度和平均功率,物理意义明确,所以本文将上述3个时域统计量作为时域特征用于后续分类器训练。由于每个采样通道都将分段提取出VMR,所以5通道的所有时域特征参数可构成15维宽度的特征向量:

V=(V1V2,…,V5M1M2,…,M5
R1R2,…,R5)

(1)

2.2 基于AR参数模型的特征提取

参数模型法是分析sEMG信号的一种重要方法,其中典型的是自回归(autoregressive,AR)模型法,该方法将sEMG信号看作是由白噪声激励某一确定系统产生的。当激励白噪声的功率和系统参数已知,就可以通过研究模型参数和性质以及白噪声输入输出关系来描述原始sEMG信号,即用参数模型的若干系数来描述sEMG信号的特性。AR模型表达式为

(2)

式中,x(n)为sEMG信号的第n个采样信号;u(n)为白噪声残差;ai为AR模型的第i个系数;P为AR模型阶数。

为保证肌电控制应用的时效性,本文选择具有较高分辨率和计算效率的Burg算法[10]来计算4阶AR模型的系数。由于每个采样通道都将分段提取出4个AR模型的参数,所以5通道的AR模型参数可以构成20维的特征向量:

V1=(a11a12a13a14a21a22,…,a51a52a53a54)

(3)

2.3 基于小波包分解系数的特征提取

sEMG信号本质上是一种非平稳生物电信号。原始表面肌电信号f(t)经小波包分解后被投影到小波包基上,获得一系列系数,利用这些系数可以进行特征提取。本文将Shannon熵作为代价函数来评估小波包分解基,即定义序列x={xj}的熵为

(4)

Pj=|xj|2/‖x2

Pj=0时,定义PjlgPj=0。

使用代价函数M(x) 评估的常用小波包基,选择db3函数进行2层小波包分解,将提取的4个分量系数作为特征参数。5个通道的所有系数构成了20维的特征向量:

V2=(w11w12w13w14w21w22,…,w51w52w53w54)

(5)

2层小波包分解树如图4所示。

图4 2层小波包分解树
Fig.4 Two layer wavelet packet decomposition tree

3 训练样本制作

3.1 活动段检测

训练样本的动作类型划分直接影响分类器训练效果,准确界定sEMG信号的活动段是类型划分的关键。图3可以看出,由于各通道sEMG信号波形具有动作同步性,因此笔者设计了3阶切比雪夫数字滤波器来提取5通道混合信号的包络线。包络线的表达式为

(6)

式中,x(·)为原始信号;akbk为滤波器参数。

图5所示为经过延时修正的原始信号包络曲线,可以看出该方法提取的包络线可以很好地贴合原始信号的轮廓。

图5 表面肌电信号包络线
Fig.5 sEMG signal envelope

3.2 动作标签添加

通过合理设置阈值可将包络曲线转换成二值状态信号。如图6a所示,传统的单一阈值法对状态转化的划分效果并不理想。信号在状态转换过渡区域存在较大波动,极易发生反复穿越阈值边界的现象,从而触发状态信号的错误翻转。为此,采用双阈值滞回比较算法获取状态转换信号:

(7)

αH>αL

在程序算法里对y(t)的变化趋势进行跟踪,仅当数据上升过程穿越上限αH或下降过程穿越下限αL才会触发状态信号翻转。

如图6b所示,通过实验方法合理设置阈值αHαL之后,状态信号错误翻转的现象得到了明显的改善。

图6 动作状态转换信号
Fig.6 Action status conversion signal

4 分类实验和结果分析

4.1 手部动作类型

手部动作类型如表1、图7所示,为所研究的19种手部动作和1种放松动作,设计了20位二进制编码形式的动作类型标签。每种动作对应1个二进制位,“1”代表有动作,“0” 代表无动作。例如:“握拳”动作的类型标签为“0000 0000 0000 0010 0000”,即从左向右第15位为1,其余位为0,动作代号为15。利用状态转换信号S(t),程序在可以自动提取特征向量的同时为其添加动作类型标签,从而完成所有参与分类器训练及测试的20万条样本数据的制作工作。

表1 手部动作模式列表

Tab.1 The list of hand action patterns

动作模式动作描述手指动作单指动作屈拇指、屈食指、屈中指、屈无名指、屈小指(动作代号:1~5)多指动作手势1~手势9、握拳、四指勾取、球形抓取(动作代号:6~17)腕部动作屈腕、翻腕(动作代号:18、19)放松动作自然松弛(动作代号:20)

图7 手部动作模式
Fig.7 Hand action mode

4.2 分类器的设计与训练

BP神经网络能够满足手部精细动作辨识分类的要求[11],为分步考察BP神经网络分类器的性能,本文将待识别动作分成3类进行训练。第一类为单指识别(单指动作+放松动作),第二类为多指识别(多指动作+放松动作),第三类为全部动作识别(手指动作+腕动作+放松动作)。前文提取的sEMG特征有时域特征(TD)、模型系数特征(AR)和小波包分解特征(WPT)。分类器的输入和输出一共有9种组合,故最终构建了9个BP神经网络分类器。分类器为3层结构,输入节点配置为15个(TD特征)、20个(AR或WPT特征)。输出节点为6个(单指识别)、13个(多指识别)、20个(全部动作识别)。实验对9种组合下的6~35个隐含层节点的情况分别进行了训练。限于篇幅,仅以表2所示的“小波包分解特征(WPT)、单指识别、26个隐含节点”的BP神经网络分类器的训练结果为例进行说明。BP神经网络分类器训练结果以混淆矩阵的形式出现,矩阵的每一行代表分类器对某一动作实际分类的正确与错误的样本分布,每一列代表原始标签样本被正确或错误分类的分布情况。

表2 26个隐含节点的BP神经网络分类器训练结果(WPT特征、单指动作)

Tab.2 Training results of BP neural network classifier with 26 hidden layer nodes(WPT feature and single finger actions)

手部动作样本动作输出屈拇指屈食指屈中指屈无名指屈小指放松实际输出正确率(%)实际动作输出屈拇指1885021002097.9屈食指014366003997.0屈中指01071679001493.3屈无名指070247204897.8屈小指02301421338594.6放松11746633953869396.5样本输出正确率(%)94.288.794.997.997.697.796.3

实验开始前,按每种动作取10 000条样本组成分类器训练与验证的总体样本,训练与验证的样本严格分离,比例为6∶4。

隐含节点和特征类型对分类器平均识别率的影响如图8所示。基于WPT特征的BP分类器(综合识别效果最佳)对3种手部动作模式的最佳识别率分别为98.5%、92.4%、90.9%。实验结果显示,随着手部动作的增多,分类器识别率呈下降趋势,但基于小波分解系数的分类器仍可以达到比较高的平均识别率;隐含节点数对分类器识别率影响都比较大,基于小波包分解系数的分类器平均识别率波动相对较小。

另外,隐含节点数量的变化趋势与分类器识别率变化趋势之间没有明显联系,TD特征下的平均识别率最佳的分类器隐含层节点数为30,AR特征下的平均识别率最佳的分类器隐含层节点数为31,WPT特征下的平均识别率最佳的分类器隐含层节点数为27。

图8 隐含节点和特征类型对分类器平均识别率的影响
Fig.8 Influence of hidden layer node and feature type on the average recognition rate of classifier

不同特征条件下的平均识别率最佳的分类器各单项动作识别率如图9所示。3种特征的单项动作识别率走势基本相同,说明sEMG信号采集方案提供的原始信息对单项动作的识别贡献程度一致。针对20种动作的复杂情况,基于AR模型参数的分类器适应性较差,平均识别率仅有51%,说明AR模型系数特征不适合应用在多模式手部动作的分类场景。基于WPT特征和TD特征的分类器训练结果良好,基于WPT特征分类器的各单项动作识别率略高于基于TD特征的分类器,二者的识别率均在80%以上。若不考虑识别率最低的4个动作,剩余16个动作的平均识别率超过90%,优于文献[6]所列的多种分类器识别成功率。

图9 3种特征的单项动作识别率对比
Fig.9 Comparison of single action recognition rate of 3 different feature

4.3 时效性分析

本文采用的sEMG采集仪转换延时小于2 ms,滑动窗延时小于128 ms。时域特征的提取算法简洁快速,单条特征向量提取耗时小于20 ms。AR系数特征向量提取耗时也较短,生成单条特征向量需32 ms。小波包分解系数特征提取较为耗时,生成单条特征向量耗时为56 ms。BP神经网络分类器的分类速度很高,从特征向量输入到识别结果输出耗时小于1 ms。所以,从sEMG采集到模式识别输出的总延时小于基于TD特征的150 ms和基于WPT特征的190 ms。因此本文提出的方法可以满足主动康复训练和普通人机交互控制领域的实时性要求。实验所使用的计算机配置如下:CPU为Intel Core i7-5500U,主频2.4 GHz,RAM为8 G,操作系统为Windows7。

5 结论

(1)根据前臂肌肉分布特点和功能区划,通过实验采样和统计对比最终确定了5通道采样电极的布局方式,在简化通道数的同时保证了高质量sEMG的拾取。

(2)提出一种多通道sEMG信号活动段检测的快捷方法,降低了划分错误率,并能够依据状态转换信号完成特征向量动作属性标签的自动添加。

(3)设计并完成了基于BP神经网络的多模式手部动作分类器,它对6种、13种和20种手部动作的最佳平均识别率分别为98.5%、92.4%、90.9%,模式分类输出延时小于190 ms。

参考文献

[1] 王行愚, 金晶, 张宇, 等. 脑控:基于脑-机接口的人机融合控制[J]. 自动化学报, 2013, 39(3): 208-221.

WANG Xingyu, JIN Jing, ZHANG Yu, et al. Brain Control: Human-Computer Integration Control Based on Brain-Computer Interface[J]. Acta Automatica Sinica, 2013, 39(3): 208-221.

[2] ROSATI G, GALLINA P, MASIERO S. Design, Implementation and Clinical Tests of a Wire-based Robot for Neurorehabilitation[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2007, 15(4): 560-569.

[3] KHUSHABA R N, KODAGODA S, TAKRURI M, et al. Toward Improved Control of Prosthetic Fingers Using Surface Electromyogram (EMG) Signals[J]. Expert Systems with Applications, 2012, 39(12): 10731-10738.

[4] 黄鹏程, 杨庆华, 鲍官军, 等. 基于FPA的气动柔性手指康复器及其控制系统[J]. 中国机械工程, 2014, 25(13): 1724-1743.

HUANG Pengcheng, YANG Qinghua, BAO Guanjun, et al. Flexible Pneumatic Finger Rehabilitation Apparatus Based on FPA and Its Control System[J]. China Mechanical Engineering, 2014, 25(13):1724-1743.

[5] 张辉. 六自由度外骨骼式上肢康复机器人设计[D]. 上海:东华大学, 2014.

ZHANG Hui. The Design of Exoskeleton Upper Limb Rehabilitation Robot with 6-Dof[D]. Shanghai: Donghua University, 2014.

[6] De LUCA C J, ADAM A, WOTIZ R, et al. Decomposition of Surface EMG Signals[J]. Journal of Neurophysiology, 2006, 96(3):1646-1657.

[7] 丁其川, 熊安斌, 赵新刚, 等. 基于表面肌电的运动意图识别方法研究及应用综述[J]. 自动化学报, 2016, 42(1): 13-25.

DING Qichuan, XIONG Anbin, ZHAO Xingang, et al. A Review on Researches and Applications of sEMG-based Motion Intent Recognition Methods[J]. Acta Automatica Sinica, 2016, 42(1):13-25.

[8] RYAIT H S, ARORA A S, AGARWAL R. Interpretations of Wrist/Grip Operations from sEMG Signals at Dierent Locations on Arm[J]. IEEE Transactions on Biomedical Circuits and Systems, 2010, 4(2): 101-111.

[9] 刘建, 邹任玲, 张东衡,等. 表面肌电信号特征提取方法研究发展趋势[J]. 生物医学工程学进展, 2015(3):164-168.

LIU Jian, ZOU Renling, ZHANG Dongheng, et al. Research and Development Trend of Feature Extraction Methods of Surface Electromyographic Signals[J]. Progress in Biomedical Engineering, 2015(3):164-168.

[10] 张峰, 王东, 石现峰. 振动信号Burg谱估计算法的性能优化研究[J]. 计算机仿真, 2017,34(4):262-266.

ZHANG Feng, WANG Dong, SHI Xianfeng. Study on Performance Optimization of Vibration Signal Burg Spectral Estimation Algorithm[J]. Computer Simulation, 2017, 34(4): 262-266.

[11] 黄鹏程, 杨庆华, 鲍官军, 等. 基于幅值立方和BP神经网络的表面肌电信号特征提取算法[J]. 中国机械工程, 2012, 23(11):1332-1336.

HUANG Pengcheng, YANG Qinghua, BAO Guanjun, et al. Feature Extraction Method Based on Amplitude Cubic and BP Neural Network of Surface Electromyography (sEMG) Signals[J]. China Mechanical Engineering, 2012, 23(11): 1332-1336.

Classification and Identification of Multi-pattern of Hand Actions

DU Mingyu WANG Zhiheng XUN Yi BAO Guanjun GAO Feng YANG Qinghua ZHANG Libin

College of Mechanical Engineering,Zhejiang University of Technology,Hangzhou, 310014

Abstract:In order to meet the needs of many human hand action pattern recognitions in complex applications such as exercise rehabilitation training and human-machine interaction, influences of sEMG signals sampling channel layouts, training sample preparations, feature extraction modes, classifier structure parameters, and so on were analysed herein. Optimal signal sampling scheme was established, and 3 BP neural network classifiers were designed based on time domain statistic, self-regression model coefficient, and wavelet packet decomposition coefficient. Experimental results show that average recognition rate of classifiers for 6 kinds of single finger actions, 13 kinds of multi finger actions, 20 kinds of hand movements are 98.5%, 92.4%, and 90.9% respectively. Output delay is less than 190 ms, which verifies effectiveness and practicability of the proposed method.

Key words:surface electromyography(sEMG); hand action; neutral network; pattern recognition

中图分类号:TP241.3

DOI:10.3969/j.issn.1004-132X.2019.12.014 开放科学(资源服务)标识码(OSID):

收稿日期2017-10-09

基金项目国家自然科学基金资助项目(51775499);浙江省自然科学基金资助项目(LQ15E050008);浙江省教育厅科研项目(Y201121563);北京市智能机器人与系统高精尖创新中心开放基金资助项目(2016IRS03)

(编辑 张 洋)

作者简介:都明宇,男,1977年生,讲师。研究方向为机器人、计算机控制。E-mail:dumingyu@zjut.edu.cn。