车杆PPO算法 | Isaac Sim Orbit-CSDN直播

要发弹幕，请先登录或注册哦！

71 · 发布于 2024-04-02 20:41:43

使用stable baseline 3 训练，PPO 算法在orbit里不仅支持多环境，对比使用DDPG算法训练的车杆，使用PPO算法训练完成的车杆明显运动的更流畅

0条评论