分享
点赞 收藏
车杆PPO算法 | Isaac Sim Orbit

27 · 发布于 2024-04-02 20:41:43

使用stable baseline 3 训练,PPO 算法在orbit里不仅支持多环境,对比使用DDPG算法训练的车杆,使用PPO算法训练完成的车杆明显运动的更流畅
漂亮_大男孩
623粉丝
关注

0条评论

还能输入1000个字符