首页
/
知识花园
/
前沿研究
🔬 前沿研究
强化学习训练、Agent框架研究
共 2 个知识节点
MetaClaw强化学习
— 在线强化学习框架 → 不用GPU/数据集,对话即训练 / SkillRL技能进化 / Tinker云训练
Claw-R1训练框架
— 中科大Runtime RL: 真实Agent环境+RL训练引擎打通 / 异步采集轨迹+奖励 / 白盒黑盒通用
/
知识星图
/
前沿研究
✦ 返回星图
🔬 前沿研究 — AI 知识图谱 | AI 趋势 | AI 趋势