下肢助力外骨骼机器人自适应阻抗控制研究

邱静; 陈启明; 卢军; 程洪; 黄瑞

doi:10.3969/j.issn.1001-0548.2016.04.022

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名

邮箱

手机号码

标题

留言内容

验证码

下肢助力外骨骼机器人自适应阻抗控制研究

电子科技大学机械电子工程学院成都 611731

基金项目:

国家自然基金 71201017

中央高校基本科研业务费 ZYGX2012J101

详细信息

作者简介:
邱静(1977-), 女, 博士, 副教授, 硕士生导师。主要从事外骨骼机器人方面的研究.2004年8月～2010年6月期间在德国达姆施塔特工业大学研究院，从事认知和组织人因工效方面等方面的研究，参与和负责了道路交通、轨道交通和航空领域的人因工程应用项目，积累了大量的人因工程应用研究经验。主要研究方向为数字化设计与仿真和工业工程。在国内外刊物发表论文20余篇

中图分类号: TP24

Learning-Based Adaptive Impedance Control for a Human-Powered Augmentation Lower Exoskeleton

School of Mechatronics Engineering, University of Electronic Science and Technology of China Chengdu 611731

摘要: 当前用于人体运动增强的下肢助力外骨骼系统获得越来越多的关注。获取高精度跟随控制是下肢助力外骨骼机器人研制的主要挑战。针对当前基于位置的控制算法需要复杂的外骨骼动力学模型的问题，该文提出了基于增强学习的变参数阻抗控制算法。首先介绍了HUALEX助力外骨骼系统并对HUALEX建立简单动力学模型。基于此，提出一种基于增强学习的自适应阻抗控制算法，验证了阻抗参数对控制效果的影响，并通过仿真实验验证了该算法的有效性。

关键词:

Abstract: A learning-based adaptive impedance control algorithm for a human-powered augmentation lower exoskeleton (HUALEX) is presented. The HUALEX system architecture is introduced first, which is divided into three parts including the mechanical subsystems, the sensing subsystem and the control subsystem. By using impedance control method, the inverse dynamics model of HUALEX is established and the control effect of impedance parameters is studied. And then, a reinforcement learning-based adaptive impedance control algorithm, including the reinforcement learning, PI² (policy improvement with path integrals) learning algorithm and adaptive impedance control, is proposed. The effectiveness of the algorithm is verified simulation experiment.

Key words:

adaptive impedance control /
dynamics model /
impedance control /
human-powered augmentation lower exoskeleton /
reinforcement learning

下肢助力外骨骼机器人自适应阻抗控制研究

电子科技大学机械电子工程学院成都 611731

基金项目:

国家自然基金 71201017

中央高校基本科研业务费 ZYGX2012J101

作者简介:
邱静(1977-), 女, 博士, 副教授, 硕士生导师。主要从事外骨骼机器人方面的研究.2004年8月～2010年6月期间在德国达姆施塔特工业大学研究院，从事认知和组织人因工效方面等方面的研究，参与和负责了道路交通、轨道交通和航空领域的人因工程应用项目，积累了大量的人因工程应用研究经验。主要研究方向为数字化设计与仿真和工业工程。在国内外刊物发表论文20余篇

收稿日期: 2016-05-15

刊出日期: 2016-07-01

中图分类号: TP24

关键词:

全文HTML

下肢助力外骨骼机器人是一种新型的可穿戴式智能设备，它将机械系统的“体力”和人类的“智力”集成到一个系统中，机械系统成为人身体的一部分，这样穿戴者就能够完成仅凭人体自身条件无法完成的任务，提高人体的运动能力和负重能力。下肢助力外骨骼机器人与其他机器人相比，最大的不同在于，“人”属于机器人的一部分而不独立于机器人存在，人体与外骨骼之间有实在的物理接触。在医疗康复、紧急救灾、军事作战等领域，下肢助力外骨骼机器人都有着非常广阔的应用前景。

最早出现的外骨骼机器人是美国通用公司在1960年研制的哈迪曼。当时由于科学技术还不够发达，计算机技术、材料、能源等领域都比较落后，导致该外骨骼机器人在结构上无法设计得较好，穿戴起来十分不便，它的实用价值受到了限制。随着技术的不断进步，出现了一些比较成功的下肢外骨骼机器人。其中最典型的是美国伯克利大学的BLEEX系统^[1-3]，BLEEX系统由两条仿生机械腿、液压驱动系统、电源模块和超过30个传感器的感知系统组成。这套外骨骼机器人系统可以帮助人体在负重45 kg的同时以2 m/s的速度前进。日本筑波大学开发的HAL系列下肢外骨骼^[4-6]，最早是应用于医护人员在照顾病人时，能够帮助医护人员进行助力辅助作用，通过外骨骼的帮助，医护人员可以轻松抱起病人，帮助日常生活有困难的病人。国内也有一些高校或机构在进行外骨骼机器人的研究工作，如中国科学院合肥智能机械研究所的助老助残外骨骼机器人^[7-8]、浙江大学的杨灿军等对下肢外骨骼步态模式生成的研究^[9]、电子科技大学机器人研究所的助力和助行外骨骼机器人^[10-11]等。

下肢助力外骨骼机器人通过感知系统得到人体的行为意图，同时对外部环境做出响应，再通过控制系统控制执行机构运行，实现外骨骼与人体运动协调一致的功能。BLEEX采用位置控制加灵敏度放大控制的混合控制算法^[12]，在不同阶段采用不同的控制算法，具有较好的控制效果。HAL通过获取肌电信号和步态预学习两种控制方式来达到助力的目的。中科院的外骨骼机器人通过多维力信息预测穿戴者的运动意图，并结合关节信息对外骨骼进行控制。文献[13]将基于模糊规则的阻抗控制应用于下肢外骨骼机器人的控制。文献[14]提出了一种分层交互式学习方法以减小下肢助力外骨骼机器人感知系统的复杂度并适应交互动力学模型的动态变化。

下肢助力外骨骼机器人的主要研究难点在于难以计算其精确的动力学模型，控制算法的精度难以保证。本文主要针对下肢助力外骨骼机器人的随动控制策略进行研究，提出了一种基于增强学习的自适应阻抗控制算法，该算法不需要知道外骨骼机器人的精确动力学模型。

5. 结束语

本文通过机械子系统、感知子系统和控制子系统3个部分对HUALEX外骨骼机器人进行了介绍，并提出应用阻抗控制算法对HUALEX进行力和位置控制。在此基础上，介绍了HUALEX的参考逆动力学模型建立方法。然后，通过实验数据说明了阻抗参数对控制效果的影响。最后，提出应用基于PI²的自适应阻抗控制算法对HUALEX进行控制，并通过仿真实验说明了PI²算法进行阻抗参数调节的效果，验证了PI²算法对HUALEX系统的阻抗参数调节的稳定性和有效性。

在未来的研究工作中将深入研究HUALEX的基于PI²的自适应阻抗控制，并将其运用于实际系统中。同时，还将加入HUALEX的步态运动阶段划分算法，实现对HUALEX的随动控制。

参考文献 (25)

[1]	KAZEROONI H. Human augmentation and exoskeleton systems in Berkeley[J]. International Journal of Humanoid Robotics, 2007, 4(3):575-605. doi: 10.1142/S0219843607001187
[2]	KAZEROONI H, STEGER R. That which does not stabilize, will only make us stronger[C]//IEEE International Conference on Rehabilitation Robotics.[S.l.]:IEEE, 2007:373-395. http://cn.bing.com/academic/profile?id=2169575066&encoded=0&v=paper_preview&mkt=zh-cn
[3]	GHAN J, KAZEROONI H. System identification for the Berkeley lower extremity exoskeleton (BLEEX)[C]//Proceedings of the 2006 IEEE International Conference on Robotices and Automation. Orlando, Florida:IEEE, 2006. http://cn.bing.com/academic/profile?id=2169051170&encoded=0&v=paper_preview&mkt=zh-cn
[4]	KAWAMOTO H, SANKAI Y. Power assist system HAL-3 for gait disorder person[J]. Lecture Notes in Computer Science, 2002, 2398:196-203. doi: 10.1007/3-540-45491-8
[5]	SANKAI Y. HAL:Hybrid assistive limb based on cybernics[J]. Springer Tracts in Advanced Robotics, 2007, 66:25-34. http://cn.bing.com/academic/profile?id=1956237300&encoded=0&v=paper_preview&mkt=zh-cn
[6]	KAWAMOTO H, SANKAI Y. Power assist method based on phase sequence driven by interaction between human and robot suit[C]//IEEE International Workshop on Robot and Human Interactive Communication.[S.l.]:IEEE, 2004:491-496.
[7]	陈峰.可穿戴型助力机器人技术研究[D].合肥:中国科学技术大学, 2006. http://cdmd.cnki.com.cn/article/cdmd-10358-2007097284.htm CHEN Feng. Research on the wearable power assist robot[D]. Hefei:University of Science and Technology of China, 2006. http://cdmd.cnki.com.cn/article/cdmd-10358-2007097284.htm
[8]	方郁.可穿戴下肢助力机器人动力学建模及其控制研究[D].合肥:中国科学技术大学, 2009 FANG Yu. Research on dynamic analysis and control of the wearable power assist robot[D]. Hefei:University of Science and Technology of China, 2009.
[9]	牛彬.可穿戴式的下肢步行外骨骼控制机理研究与实现[D].杭州:浙江大学, 2006. http://cdmd.cnki.com.cn/article/cdmd-10335-2006175574.htm NIU Bin. Study on the design and control of a wearable exoskeleton leg for humans walking power augmentation[D]. Hangzhou:Zhejiang University, 2006. http://cdmd.cnki.com.cn/article/cdmd-10335-2006175574.htm
[10]	HUANG R, CHENG H, ZHENG H, et al. Study on master-slave control strategy of lower extremity exoskeleton robot[C]//Intelligent Control and Automation.[S.l.]:IEEE, 2014:1362-1365.
[11]	HUANG R, CHENG H, CHEN Q, et al. Interactive learning for sensitivity factors of a human-powered augmentation lower exoskeleton[C]//IEEE/RSJ International Conference on Intelligent Robots and Systems(RIOS).[S.l.]:IEEE, 2015.
[12]	KAZEROONI H, RACINE J L, HUANG L, et al. Hybrid control of the Berkeley lower extremity exoskeleton (BLEEX)[J]. International Journal of Robotics Research, 2006, 25(5-6):561-573. doi: 10.1177/0278364906065505
[13]	TRAN H T, CHENG H, DUONG M K, et al. Fuzzy-based impedance regulation for control of the coupled human-exoskeleton system[C]//IEEE Robotics and Biomimetics (ROBIO).[S.l.]:IEEE, 2015:986-992.
[14]	HUANG R, CHENG H, GUO H L, et al. Hierarchical interactive learning for a human-powered augmentation lower exoskeleton[C]//IEEE International Conference on Robotics and Automation (ICRA).[S.l.]:IEEE, 2016.
[15]	VAUGHAN C L. Dynamics of human gait[M]. Illinois, USA:Human Kinetics Publishers, 1992.
[16]	KELLY R, DAVILA V S, LORÍA A. Control of robot manipulators in joint space[M]. London:Springer, 2005.
[17]	ROSE J, GAMBLE J G. Human walking[M].[S.l.]:Williams & Wilkins, 1994.
[18]	BOWKER J H, MICHAEL J W. Atlas of limb prosthetics:Surgical, prosthetic, and rehabilitation principles[M].[S.l.]:Mosby-Year Book, 1992.
[19]	SERAJI H, COLBAUGH R. Force tracking in impedance control[C]//IEEE International Conference on Robotics and Automation.[S.l.]:IEEE, 1993:97-117.
[20]	HUANG L, GE S S, TONG H L, et al. An adaptive impedance control scheme for constrained robots[J]. International Journal of Computers, Systems and Signals, 2004, 5(2):17-26. http://cn.bing.com/academic/profile?id=2107790526&encoded=0&v=paper_preview&mkt=zh-cn
[21]	SUTTON R S, BARTO A G. Reinforcement learning:an introduction[M]. Cambridge:MIT, 1998.
[22]	WATKINS C. Learning from delayed rewards[J]. Robotics and Autonomous Systems, 1995, 15(4):233-235. doi: 10.1016/0921-8890(95)00026-C
[23]	SINGH S, JAAKKOLA T, LITTMAN M L, et al. Convergence results for single-step onpolicyreinforcement-learning algorithms[J]. Machine Learning, 2000, 38(3):287-308. doi: 10.1023/A:1007678930559
[24]	THEODOROU E, BUCHLI J, SCHAAL S. A generalized path integral control approach to reinforcement learning[J]. Journal of Machine Learning Research, 2010, 11(11):3137-3181. http://cn.bing.com/academic/profile?id=1925816294&encoded=0&v=paper_preview&mkt=zh-cn
[25]	ARIMOTO S, HAN H Y, CHEAH C C, et al. Extension of impedance matching to nonlinear dynamics of robotic tasks[J]. Systems & Control Letters, 1999, 36(2):109-119. http://cn.bing.com/academic/profile?id=2059857205&encoded=0&v=paper_preview&mkt=zh-cn

[1]	郭志成, 刘影, 陈钰书, 唐明. 复杂网络上具有自适应行为的故障-恢复传播动力学研究 . 电子科技大学学报, 2024, 53(): 1-9. doi: 10.12178/1001-0548.2023080
[2]	冯昱澍, 刘昆, 冯健. 航天器姿态跟踪有限时间自适应积分滑模控制 . 电子科技大学学报, 2021, 50(4): 527-534. doi: 10.12178/1001-0548.2021068
[3]	林自展, 肖井华, 周金连, 吴晔. 基于观点动力学的在线点评研究 . 电子科技大学学报, 2020, 49(1): 155-160. doi: 10.12178/1001-0548.2018320
[4]	刘冰, 李宁, 于鹏, 杨铁, 陈文远, 杨洋, 王文学, 姚辰. 上肢康复外骨骼机器人控制方法进展研究 . 电子科技大学学报, 2020, 49(5): 643-651. doi: 10.12178/1001-0548.2020212
[5]	林俊锋. 基于引入隐形传播者的SEIR模型的COVID-19疫情分析和预测 . 电子科技大学学报, 2020, 49(3): 375-382. doi: 10.12178/1001-0548.2020083
[6]	梅文娟, 刘震, 朱静怡, 杜立. 新冠肺炎疫情极限IR实时预测模型 . 电子科技大学学报, 2020, 49(3): 362-368. doi: 10.12178/1001-0548.2020063
[7]	刘金华, 况祥, 钟伟锋, 周文辉. 电动汽车动态无线充电自适应控制方法 . 电子科技大学学报, 2019, 48(4): 533-538. doi: 10.3969/j.issn.1001-0548.2019.04.009
[8]	章军辉, 李庆, 陈大鹏. 车辆多模式多目标自适应巡航控制 . 电子科技大学学报, 2018, 47(3): 368-375. doi: 10.3969/j.issn.1001-0548.2018.03.008
[9]	陈启明, 黄瑞. 下肢外骨骼机器人意图识别算法研究 . 电子科技大学学报, 2018, 47(3): 330-336. doi: 10.3969/j.issn.1001-0548.2018.03.002
[10]	Rui HUANG, Hong CHENG, Hong-liang GUO. Learning Virtual Impedance for Control of a Human-Coupled Lower Exoskeleton . 电子科技大学学报, 2018, 47(3): 321-329. doi: 10.3969/j.issn.1001-0548.2018.03.001
[11]	王洪艳, 刘春洁, 黄智. 基于自适应边界能量法的柔顺力控制研究 . 电子科技大学学报, 2017, 46(6): 949-954. doi: 10.3969/j.issn.1001-0548.2017.06.026
[12]	王伟, 舒盼盼, 唐明, 高辉. 网络传播动力学模拟方法评述 . 电子科技大学学报, 2016, 45(2): 288-294.
[13]	周群, 徐懿, 张金保, 宁佳, 曾雪洋. I²控制Buck变换器的一阶动力学分析 . 电子科技大学学报, 2016, 45(3): 387-392. doi: 10.3969/j.issn.1001-0548.2016.02.013
[14]	周文辉, 钟伟锋, 余荣. 智能电网中电动汽车充电的自适应电价控制方法 . 电子科技大学学报, 2015, 44(4): 636-640. doi: 10.3969/j.issn.1001-0548.2015.04.028
[15]	王洪艳, 陆金波. PHCC平台下鲁棒性阻抗控制算法的研究 . 电子科技大学学报, 2014, 43(5): 794-800. doi: 10.3969/j.issn.1001-0548.2014.05.028
[16]	王昱青, 陈华富, 尧德中. 一种扩展的功能磁共振BOLD动力学模型研究 . 电子科技大学学报, 2007, 36(2): 291-293.
[17]	董秀成, 杨光, 雷霖. 自适应Smith预估极点配置自效正PI控制器 . 电子科技大学学报, 2000, 29(1): 69-72.
[18]	阮成礼. 悬置共面波导的特性阻抗 . 电子科技大学学报, 1999, 28(1): 32-36.
[19]	徐红兵, 吕炳朝, 陈光. 一类非线性动力学系统的变结构混沌控制 . 电子科技大学学报, 1999, 28(3): 283-285.
[20]	杜正伟, 阮成礼. GTEM cell的特性阻抗 . 电子科技大学学报, 1997, 26(4): 378-381.

留言板