新闻中心
-
02-15谷歌提出全新RLHF方法:消除奖励模型,且无需对抗性训练效果更稳定,实现更简单。大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的...
-
02-05CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!CMU和ETHZurich团队合作开发了名为"敏捷但安全"(ABS)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。该框架不仅...
-
10-03令人不安的是,机器狗已经具备这种能力了使用单一的神经网络实现操纵,是四足机器人领域的一项重大技术突破跑酷是一项极限运动,需要参与者以高度动态的方式跨越障碍,对于大多数时候「笨手笨脚」的机器人来说,这...
-
共1页 3条

