快速入门：Hello MotrixLab#

本教程通过演示一个简单例子 - 加载倒立摆并进行训练，以此来展示 MotrixLab 工作流程：

环境预览#

我们提供了一个简单的脚本，用于可视化一个环境，而不执行任何训练，这可以帮助您检测系统的环境依赖是否配置正确：

uv run scripts/view.py --env cartpole

这将打开一个可视化窗口，显示倒立摆的物理仿真环境，使用随机动作进行演示。

训练模型#

开始训练倒立摆平衡任务：

uv run scripts/train.py --env cartpole

训练过程会自动：

根据硬件环境自动选择训练后端（JAX 或 PyTorch）
创建训练环境
开始 PPO 算法训练

训练结果会保存在 runs/cartpole/ 目录下，包含：

训练检查点（checkpoint）
TensorBoard 日志文件

可视化训练过程#

如果您想要在训练过程中观察模型的学习过程，可以启用可视化渲染：

uv run scripts/train.py --env cartpole --render

🎮 交互式渲染控制#

重要提示：可视化会显著降低训练速度，建议主要用于调试和演示。

在可视化训练过程中，您可以使用空格键来动态控制渲染：

开启渲染：按下空格键开启可视化，观察机器人行为
关闭渲染：再次按下空格键关闭渲染，提升训练速度
随时切换：无需重新启动程序，可以在训练过程中随时切换

这种交互式控制让您可以在需要时观察训练效果，在不需要时享受快速训练。这项功能在运行推断时也能生效。

查看训练结果#

使用 TensorBoard 查看训练进度：

uv run tensorboard --logdir runs/cartpole

测试训练好的模型#

训练完成后，使用训练好的策略进行测试：

# 自动寻找最佳策略测试（推荐）
uv run scripts/play.py --env cartpole

# 手动指定策略文件测试（如果需要特定版本）
uv run scripts/play.py --env cartpole --policy runs/cartpole/YOUR_RESULT_NUMBER/best_agent.pickle

提示：系统会自动在 runs/cartpole/ 目录下寻找最新、最佳的策略文件。通常情况下，使用自动发现功能即可。

至此我们完成了整个示例#

接下来可以尝试修改参数，观察不同设置下的物理效果，或者尝试其他环境。

下一步#

了解基础框架
学习物理环境配置
查看更多训练示例