新闻中心

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

2025-01-09
浏览次数:
返回列表

mit何恺明团队突破机器人训练瓶颈,赋予机器人“通用大脑”

机器人领域的“通用智能”探索取得重大进展!MIT何恺明教授及其团队,包括Lirui Wang、赵家梁和Meta研究员陈鑫磊,提出了一种名为“异构预训练Transformers”(HPT)的新架构,有效解决了机器人训练数据异质性难题,让机器人离拥有“通用大脑”的目标更近一步。 这项研究成果即将发表于神经信息处理系统会议(NeurIPS)。

传统机器人训练依赖于为每个任务、环境甚至硬件单独采集数据,效率低下且成本高昂(可能高达数百万美元)。 为了克服这一挑战,研究团队另辟蹊径,专注于让现有数据实现“通用化”,而非简单地增加数据量。

HPT架构的核心在于将不同来源的数据(模拟数据和真实机器人传感数据)统一到一种共享的“语言”中。 无论数据来自视觉传感器还是机械臂位置编码器,HPT都能将其转化为通用格式,避免了重复的数据收集和浪费。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

HPT架构由三个模块组成:Stem(茎)、Trunk(树干)和Head(头)。Stem负责将不同类型的数据转化为标准化的令牌序列;Trunk利用Transformer架构将这些令牌转化为共享的潜在表示;Head则将潜在表示转化为具体的动作指令。

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

HPT的设计灵感源于GPT-4等大语言模型的“大规模预训练+少量微调”模式。 研究团队构建了一个包含52个数据集、20万条机器人轨迹的大型数据集,涵盖了人类演示视频和模拟数据。 在预训练阶段,HPT仅调整Trunk参数;在微调阶段,再根据具体任务调整Stem和Head参数,从而实现高效的迁移学习。

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

HPT的优势在于其高通用性、高效性和低成本。在模拟和实际测试中,其性能比传统训练方式提升了20%以上。 更重要的是,HPT不仅处理视觉数据,还支持直接处理传感器采集的原始信号,进一步扩大了数据使用范围。

Perplexity Perplexity

Perplexity是一个ChatGPT和谷歌结合的超级工具,可以让你在浏览互联网时提出问题或获得即时摘要

Perplexity 302 查看详情 Perplexity

这项研究特别重视本体感知,即机器人对自身状态(关节角度、末端执行器位置等)的感知能力。 将本体感知与视觉数据同等重要地处理,使机器人能够更精确地完成复杂任务,例如拧紧螺钉或拿稳易碎物品。

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

研究团队的最终目标是创建一个“通用机器人大脑”,让机器人训练像下载APP一样简单,无需繁琐的数据收集和培训。 这将极大地推动机器人技术的普及和应用。

作者简介: 文中简要介绍了何恺明、Lirui Wang、赵家梁和陈鑫磊的背景和研究方向。

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

(图片均已按照原文顺序和格式保留)

以上就是“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样的详细内容,更多请关注其它相关文章!


# 2025  # 来了  # 玩出  # 新花样  # 转化为  # 令牌  # 多项  # 免费试用  # 开源  # 新进展  # 机器人技术  # 绍兴seo监控排名  # 清河区网站推广价格  # 山东提供网站建设地址  # 巴彦淖尔网络营销推广策略  # 湖南网站seo推广公司  # 宜都宜昌网站建设商家  # 网站专业优化公司  # 论坛系统seo  # 内链优化网站  # 政府网站优化理念  # 的是 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 春运抢票技巧攻略  苹果16有哪些款式的  显示器的power是什么意思  1tb等于多少mb  cos150度等于多少  ts什么意思  如何用adb命令停用系统软件  显示器power接口是什么意思  typescript有哪些版本  虚拟机服务器如何关机命令  折叠屏手机选择哪个好  虚拟机如何用命令清除垃圾  什么软件能下载夸克视频  对象数组怎么用j*a  固态硬盘如何接主机  faq是什么意思  市盈率是负数是什么意思  typescript中范围如何设定  空调控制面板power灯一直亮是什么意思  react怎么用typescript  power在充电器上是什么意思  如何安装固态硬盘win10  8寸照片尺寸多少厘米  春运抢票准备什么  j*a怎么把数组输出  如何在命令行写j*a程序  春运抢票哪个平台好一点  液位传感器power是什么意思  市盈率tt的扣非是什么意思  电瓶车屏幕上显示power是什么意思  春运抢票多久可以买到票  typescript怎么写call方法  折叠屏手机哪个牌子性价比高  怎么打印数组j*a  typescript要用什么工具  如何管理员打开cmd命令行窗口  65寸电视长宽多少厘米  跑分是什么意思  typescript是什么软件  春运抢票准备什么东西  如何查看邮件域名解析  电信开通nfc功能是什么意思  市盈率底下 18A 19E 是什么意思  春运抢票要用抢票软件吗  单片机怎么读取电流值  drawing是什么意思  如何更新typescript  固态硬盘2m如何修复  苹果16有哪些bug  多少毫安的充电宝可以带上飞机 

搜索