-
研究表明,脑卒中已成为全球第二大致死病因,成人第一大致残病因。其中,近80%的脑卒中存活者会发生不同程度的肢体功能运动障碍,导致生活不能自理,严重影响人们的日常生活活动能力以及生活质量[1-4]。脑卒中后及时有效的康复训练有助于患者运动功能恢复以及脑功能重塑[5]。传统的康复治疗手段主要是通过康复治疗师手动或采用一些简单的仪器设备对患者进行一对一的康复训练。在康复治疗师数量、康复效率及医疗成本等方面均无法满足患者治疗需求。机器人系统具有特有的优势,可以克服康复治疗师紧缺以及人工康复耗时、昂贵的问题限制[6],因此,机器人辅助康复非常适用于康复训练并得到越来越广泛的研究[7]。自20世纪90年代末以来,就已经出现了大量有关中风后康复的机器人设备[8]。通过采用符合康复要求的辅助策略,来提供长期高强度的治疗性训练。截至目前,在这些机器人系统中,与人类手臂解剖结构相似并与患肢并行工作的上肢康复外骨骼机器人系统引起了广泛的研究兴趣[9]。
在众多上肢康复外骨骼机器人的研究中,控制策略是其中的核心技术,其科学性与人机融合性影响着康复效果。受患者康复治疗时间线的启发,定义了两类控制策略:一类是由于患者自身无法运动,需要机器人起引导运动作用的被动控制策略;一类是患者自身具有一定运动能力,由机器人起跟随运动作用的主动控制策略。康复治疗的过程可以分为三个时期:软瘫期、痉挛期以及恢复期。针对不同患病阶段的患者,需要设计与其需求相对应的控制策略。当患者处于软瘫期时,肌肉张力消失或者不足,自身难以提供力量完成康复运动;当处于痉挛期时,肌肉张力有所恢复,但状态不稳定容易痉挛多发;当处于恢复期时,肌肉力量逐渐恢复,患者具有了一定的运动能力。因此,被动控制策略可以在康复治疗的全过程发挥作用,主动控制策略则更加适用于康复治疗过程中的恢复期。由此可见,相较于传统机器人来说,上肢康复外骨骼机器人的控制增加了一定的复杂性,应用不同的控制策略将直接影响到控制系统的性能指标及康复效果。上肢康复外骨骼机器人系统的控制适应性、鲁棒性、准确性与柔顺性影响着辅助康复效果。所以,开发更高效的控制策略以辅助患者恢复运动能力将是当前外骨骼机器人系统发展的主要方向[10-11]。
本文从被动控制以及主动控制两方面综述了上肢康复外骨骼机器人的研究进展。阐述了不同控制方法应用于上肢康复外骨骼机器人中的情况,详细介绍了它们的特点与研究现状。此外,本文还提出了目前发展中潜在的应用与可能面临的挑战,最后对未来应用于上肢康复外骨骼机器人的控制方法进行展望。
HTML
-
当患者处于恢复期时,肢体肌肉力量增强,能够具有一定的运动能力。在这一时期要求上肢康复外骨骼机器人由初期的引导运动过渡到跟随运动,可以采用主动控制策略进行控制,包括阻抗/导纳控制、自适应控制、协调控制、智能控制等。
-
阻抗控制自Hogan提出以来[28],经过不断的研究发展,如今已经成为机器人领域的经典控制方法。阻抗控制可分为基于力的阻抗控制和基于位置的阻抗控制即导纳控制,且两者对偶。阻抗控制通过分析机器人末端与环境之间的动态关系将力控制与位置控制综合考虑起来,用相同的策略实现力控制和位置控制[29-32]。
文献[33]提出了一种利用生物信号对上肢康复外骨骼机器人进行自适应阻抗控制的方法。该方法通过建立人体上肢的参考骨骼肌肉模型,并进行实验校准,以匹配操作者的运动行为。采用阻抗算法通过肌电信号传输人体刚度,设计出最优的参考阻抗模型。除此之外,文献[34]针对所研制的外骨骼机器人,提出了一种自适应导纳控制框架来处理人体的运动意图以及机器人动力学模型未知的问题。该框架由双控制回路构成。利用内环以反馈的方式处理机器人动力学的未知质量和惯性矩,利用外环考虑人体运动意图来调整交互模型,利用自适应技术对内环中的未知动态进行处理,保证了外环执行任务的效果。实验表明,该导纳控制方法在人与机器人的物理交互任务中具有较好的控制性能,能够有效地实现人体对外骨骼机器人的导纳控制。
文献[35]设计了一个七自由度的上肢康复外骨骼机器人,为了实现被动训练与主动训练模式的自由切换,选用了基于模糊滑模导纳控制的控制策略。由导纳控制建立出患者和外骨骼之间的交互力以及康复训练轨迹调节量之间的动态关系。通过调整导纳参数,调节患者的训练过程,增强了人机交互的柔顺性,提高了患者治疗的参与程度。而另一组设计开发出一种新的上肢外骨骼患者协作控制框架,提出一种基于最小介入的导纳控制策略,来引导患者积极参与,并在训练中最大限度地利用恢复的运动功能。所开发的控制方法可以基于患者的运动能力转化为三种不同的控制模式,即人导模式、机器人辅助模式和运动受限模式,根据患者的运动意图调节不同工作区域的人机交互[36]。
-
在上肢康复外骨骼机器人的控制任务中,会出现被控系统具有参数不确定或参数未知变化等问题。自适应控制方法可以通过参数在线校正或估计解决这类问题。文献[37]考虑到动力学建模未知以及环境干扰等问题。在给定前臂位置期望轨迹的情况下,利用自适应模糊逼近器估计人与机器人系统的动态不确定性,并利用迭代学习方法对未知时变周期扰动进行补偿。该控制器不需要精确的外骨骼模型,在未知动力学模型的情况下,进行了3组对比实验。结果表明,使用所提出的控制器跟踪误差可以收敛得越来越小,而这一良好性能主要是由于“自适应”机制,验证了该控制方案的有效性。
文献[38]研究了具有五自由度的上肢康复外骨骼机器人,该机器人受到不确定动力学、干扰力矩、不可全状态测量和不同类型的驱动故障的影响。因此,提出了一种基于滑模控制策略的自适应非线性控制方案。方案将高增益状态观测器与动态高增益矩阵相结合,将模糊神经网络分别用于状态向量和非线性动态估计。利用动态参数,为同时处理模糊神经网络逼近误差、扰动力矩和驱动故障的影响提供了一种有效的方法。仿真表明,采用这一方法可以获得较低振幅的无抖振力矩,且具有响应快、跟踪精度高等优点。在接下来的研究中,将是对基于观测器的自适应容错控制器进行设计。
文献[39]提出了一种基于肌电信号的神经模糊外骨骼控制器的有效自适应控制。该控制过程分为3个阶段,分别是输入信号选择阶段、姿态区域选择阶段、神经模糊控制阶段。当外骨骼的使用者发生改变时,外骨骼的控制器必须使用所提出的适应策略来适应新使用者的物理和生理条件。控制器自适应采用用户指示其运动意图的运动指示器。该指示器可以有效地指示关节的各项运动和肘关节、肩关节的协同运动。同时,肌肉活动水平也在外骨骼的适应阶段根据用户的情况或康复阶段进行调整。通过实验验证了该自适应方法的科学有效性。
为了确保在参数不确定性和环境干扰下轨迹跟踪的准确性,文献[40]提出一种基于径向基函数网络的神经模糊自适应控制方案。通过李亚普诺夫稳定性理论,证明了该方案的稳定性。通过对一名健康受试者与两名脑卒中患者进行位置跟踪实验和频响实验表明,这一方法的提出比较级联PID控制器和模糊滑模控制器的控制性能,能够获得较低的位置跟踪误差和较好的频响特性。
文献[41]研究了输入饱和状态下上肢外骨骼的控制设计,提出了利用神经网络来近似不确定的机器人动力学的自适应控制器。采用辅助系统来处理输入饱和的影响,使用状态反馈和输出反馈从测量的反馈误差在线估计不确定性,代替了基于模型的控制。通过干扰观测器,在线抑制未知干扰,实现了轨迹跟踪。通过实验研究,证明了该方法的有效性。然而,实验中也显示出这些控制器在饱和较小时使用的局限性,所以在线学习控制方案有望在不久的将来被开发出来用以优化控制性能。
-
随着康复训练不断深入,患者需要外骨骼机器人提供的帮助会越来越少。为了响应被控对象性能随时间变化,提高人机交互的水平,提出了协调控制方法。
对于外骨骼机器人的协调研究,是为了增强机器人的行为能力,解决其运动控制方面的问题。考虑到患者恢复过程运动能力不断增强,其主观运动意图明显,这时要求控制方法的目的是调节运动过程中的协调效应,即控制各关节位置或相对于其他关节的速度,以保证上肢康复外骨骼机器人能够柔顺运动,不对人体造成二次伤害。文献[42]设计了一个双臂外骨骼系统,提出了非对称双手协调控制策略以执行协作操作,保证运动的柔顺性。
-
在人工智能飞速发展的大环境下,用于上肢康复外骨骼机器人的一些自身具有学习能力的智能控制方法逐渐得到研究人员的重视。例如神经网络控制方法、强化学习控制方法。
文献[43]提出了一种基于贪心神经网络控制器的神经损伤患者上肢康复训练方案。该控制模式包括一个基线控制器和一个高斯径向基函数网络,该网络用于模拟受试者的功能能力,并为受试者提供相应的任务挑战。为了鼓励受试者的主动参与,基于贪心策略对评价受试损伤程度的径向基函数网络的权向量进行更新,使受试提供的最大力量随时间的推移逐步被学习。同时,根据受试者的任务表现,采用挑战等级修正算法对任务挑战进行调整。通过实验表明,所提出的控制器对促进受试者在训练过程中的自愿参与度具有显著的潜力。然而,该工作仅使用平均误差作为评估受试者任务绩效的指标。如何对运动质量进行更准确的评估,例如是否可以通过对照临床试验来评估该控制方法的治疗效果,是未来的一个研究重点。
除神经网络控制方法之外,已有大量研究表明强化学习控制方法适用于上肢康复外骨骼机器人的控制。引入强化学习控制方法不但可以降低系统设计时,过多依赖于专家知识、先验知识、精确的训练样本以及示教信息等内容,还可以通过与被控对象间的交互,逐步优化系统的控制性能[44]。
强化学习是控制模拟上肢功能性电刺激系统的一种方法。文献[45]应用强化学习设计了一种用于外骨骼系统的非线性控制器。强化学习方法通过与环境的相互作用来学习,为了有效地利用收集到的数据,通过人工神经网络模型来模拟大量的经验片段。将该控制方案与PID控制比较,并对5名健康受试者在平面伸展实验中的表现进行比较。结果表明,两个控制器都正确地驱动手臂到目标位置,平均绝对误差<1°。但强化学习控制在整定时间、位置精度和平滑度方面明显优于PID控制。
文献[46]提出了一个机器人训练器的框架。它是用户自适应的,既不需要特定的期望轨迹,也不需要用户的运动系统的物理模型,通过使用无模型强化学习来实现这一点。在该研究中,采用了一种策略梯度类型的强化学习算法作为辅助机器人训练的核心。该学习算法的目标是使任务完成度最大化,同时使机器人的辅助力最小化。策略梯度方法的一个优点是可以选择对任务有意义的状态和策略表示并合并领域知识,这通常在学习过程中比基于值函数的方法需要更少的参数;另一个优点在于它是一种无模型方法。基于以上优点,该方法已应用于机器人学习研究中,包括人机交互研究。
文献[47]在2016年提出直接从用户和机器人之间的交互来学习辅助策略。将辅助策略的学习问题表述为策略搜索问题。为了减轻用户在数据获取方面的负担,开发了一个基于数据效率的模型强化学习框架。使用开发的实验平台,验证了该方法的有效性。对于机械臂辅助控制任务的学习实验,仅通过30 s的交互就可以获得实现机器人控制任务并减少用户肌电信号的适当辅助策略。
基于以上基础,文献[48]又在2017年对模型强化学习框架进行了丰富。在成本函数中并没有明确提供所需的轨迹,而是只考虑用户通过肌电信号测量的肌肉运动来学习辅助策略,使用户通过自己的意图动作来执行任务。由于肌电信号是通过用户自己的肌肉产生而不是机器人的协助来实现的,所以肌电信号可以被理解为当前协助的“成本”。将改进的方法应用到一自由度的外骨骼机器人上,并进行了一系列的实验。结果表明,该方法学习了正确的辅助策略,明确地考虑了用户和机器人之间的双向交互只有60 s,同时能够有效地处理机器人动力和运动轨迹的变化。对于上述的上肢康复训练系统的主要特征如表1所示。
文献 名称 自由度 控制方法 验证实验 实验结果 [43] CASIA-ARM 2 神经网络控制 12名神经功能运动障碍受试者参与
伸展康复实验。验证了控制器的性能与可行性且确实刺激了
被试者的积极参与度。[45] right arm passive exoskeleton 3 强化学习控制 5名健康男性受试者进行平面
伸展运动实验。验证了强化学习在在整定时间、位置精度和平滑度方面明显优于PID控制。驱动运动更快且平滑自然,很少产生过冲。 [47] one-link rigid robot arm 1 强化学习控制 1名受试者试图通过EMG信号将模拟的机器人手臂移动到期望的角度。 验证了该方法在学习辅助策略方面的有效性。 [48] upper-limb elbow-joint exoskeleton robot 1 强化学习控制 受试者移动肘关节来跟踪目标
关节轨迹。该方法具有良好的样本效率,是学习辅助
策略的有效方法。到目前为止,临床研究还不能证明机器人治疗优于传统方法。根据个体的运动缺陷进行个性化的机器人辅助治疗可能有助于实现这一目标。因此,个性化控制这一智能控制方法开始广受关注[49]。
文献[50]提出了一种统计方法,自动个性化机器人康复。该方法使用不同的运动表现指标来评估运动改善并在治疗期间适应运动任务。将该方法在患者身上进行测试,结果与接受传统物理治疗的类似患者进行了比较。试验结果显示,使用个性化机器人方法训练的受试者在临床测试、运动学和肌肉活动方面有更好的结果。
文献[51]设计了一种基于患者定制方法的三维上肢康复机器人系统,它通过将患者包含在控制回路中,实时调整治疗特性以适应患者的需求。该系统由七自由度机器人手臂、自适应交互控制系统和患者性能评估模块组成。它通过一个不显眼的感知系统记录患者的生物力学数据,评估患者的生物力学状态,更新机器人的控制参数,以修改三维空间中的辅助水平和任务复杂性。通过对健康受试者进行实验,验证了该系统的可靠性,并提供了二维和三维空间的结果。
文献[52]考虑到如何优化上肢外骨骼康复机器人的效用,采用最陡梯度这一新的原则进行运动性能的选择。其原理是基于映射整个工作空间的运动性能,然后选择位于性能最好和最差之间最陡峭的过渡区域的运动。为了评估该原则的好处,进行了对照试验,分别比较了15次机器人辅助触达训练对两组因中风而患有中重度慢性上肢偏瘫患者上肢运动障碍的效果。与对照组相比,实验组有明显改善,但是实验也表明该方法更加适用短期训练。在未来的发展中,下一步将是评估较长时间的个性化培训以及这个原理是否适用于其他运动障碍例如步态运动,或者其他设备例如下肢外骨骼,甚至一些不需要辅助力的设备。