快速入门:Hello MotrixLab#
本教程通过演示一个简单例子 - 加载倒立摆并进行训练,以此来展示 MotrixLab 工作流程:
环境预览#
我们提供了一个简单的脚本,用于可视化一个环境,而不执行任何训练,这可以帮助您检测系统的环境依赖是否配置正确:
uv run scripts/view.py --env cartpole
这将打开一个可视化窗口,显示倒立摆的物理仿真环境,使用随机动作进行演示。
训练模型#
开始训练倒立摆平衡任务:
uv run scripts/train.py --env cartpole
训练过程会自动:
根据硬件环境自动选择训练后端(JAX 或 PyTorch)
创建训练环境
开始 PPO 算法训练
训练结果会保存在 runs/cartpole/ 目录下,包含:
训练检查点(checkpoint)
TensorBoard 日志文件
可视化训练过程#
如果您想要在训练过程中观察模型的学习过程,可以启用可视化渲染:
uv run scripts/train.py --env cartpole --render
🎮 交互式渲染控制#
重要提示:可视化会显著降低训练速度,建议主要用于调试和演示。
在可视化训练过程中,您可以使用空格键来动态控制渲染:
开启渲染:按下空格键开启可视化,观察机器人行为
关闭渲染:再次按下空格键关闭渲染,提升训练速度
随时切换:无需重新启动程序,可以在训练过程中随时切换
这种交互式控制让您可以在需要时观察训练效果,在不需要时享受快速训练。这项功能在运行推断时也能生效。
查看训练结果#
使用 TensorBoard 查看训练进度:
uv run tensorboard --logdir runs/cartpole
测试训练好的模型#
训练完成后,使用训练好的策略进行测试:
# 自动寻找最佳策略测试(推荐)
uv run scripts/play.py --env cartpole
# 手动指定策略文件测试(如果需要特定版本)
uv run scripts/play.py --env cartpole --policy runs/cartpole/YOUR_RESULT_NUMBER/best_agent.pickle
提示:系统会自动在
runs/cartpole/目录下寻找最新、最佳的策略文件。通常情况下,使用自动发现功能即可。
至此我们完成了整个示例#
接下来可以尝试修改参数,观察不同设置下的物理效果,或者尝试其他环境。