Back to Search Start Over

基于改进TD3算法的机械臂智能规划方法研究

Authors :
张强
文闻
周晓东
刘维惠
初晓昱
Source :
智能科学与技术学报, Vol 4, Iss 2, Pp 223-232 (2022)
Publication Year :
2022
Publisher :
POSTS&TELECOM PRESS Co., LTD, 2022.

Abstract

针对某卫星搭载的4自由度机械臂轨迹规划问题,提出了一种基于改进的双延迟深度确定性策略梯度(TD3)算法的智能规划方法。该方法采用分阶段训练策略,在预训练阶段,采用了目标位置引导联合TD3算法进行轨迹优化的混合规划策略,训练结束后规划算法能够在机械臂关节空间对任意起点、终点进行速度轨迹的自主规划。这种目标引导机制减少了训练时不必要的探索,在一定程度上解决了高维动作空间中学习效率低下的问题。在二次训练阶段,首先通过示教获得一条无碰撞的安全参考轨迹,然后在训练过程中不断对这条轨迹进行模仿,使得最终算法输出的轨迹具备避障能力。

Details

Language :
Chinese
ISSN :
20966652
Volume :
4
Issue :
2
Database :
Directory of Open Access Journals
Journal :
智能科学与技术学报
Publication Type :
Academic Journal
Accession number :
edsdoj.66f24faaf2f4442be582de9db7b0368
Document Type :
article
Full Text :
https://doi.org/10.11959/j.issn.2096-6652.202225