新闻中心
InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型
InternVLA·M1是什么
internvla·m1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策略,先通过空间感知预训练,增强空间推理与规划能力;再以隐式空间推理方式实现高效的动作后训练。仅需“空间规划提示”即可高效训练,大幅降低成本。在 simplerenv 等公开操作基准测试中,internvla·m1 达到国际领先水平,其指令跟随与未见物体泛化能力显著优于其他同类模型。依托自研*平台 interndata-m1 完成大规模预训练,适用于复杂场景及长程任务。
GoEnhance
全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。
347
查看详情
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

InternVLA·M1的主要功能
- 高阶空间推理与任务规划:负责复杂环境下的空间推理和任务规划,能理解指令并生成相应的操作序列。
- 双系统操作架构:采用两阶段训练策略,先进行空间感知预训练,再进行动作后训练,提升模型的推理和规划能力。
- 高效训练与成本控制:通过“空间规划提示”实现高效训练,大幅降低训练成本和时间。
- 指令跟随与泛化能力:在多种公开基准测试中表现优异,尤其在指令跟随和未见物体泛化方面表现突出。
- 自主学习与闭环控制:构建了“思考-行动-自主学习”的完整闭环,能够通过自主学习不断优化操作策略。
- 复杂场景适应性:在真机复杂场景及长程任务中表现出色,适用于多种实际应用场景。
InternVLA·M1的技术原理
- 双系统架构:结合空间感知预训练和动作后训练,增强模型对空间环境的理解和操作能力。
- 空间感知预训练:通过大规模*数据,训练模型对空间关系的感知和推理能力,为后续任务规划奠定基础。
- 动作后训练:利用隐式空间推理方式,使模型能高效地学习具体动作的执行,提升操作精度。
- 空间规划提示:引入空间规划提示机制,帮助模型更高效地进行任务规划和动作生成,降低训练复杂度。
- 闭环控制:构建“思考-行动-自主学习”的闭环系统,使模型能在实际操作中不断学习和优化,适应复杂环境。
- 大规模*数据:依托自研*平台 InternData-M1,生成大量高质量的训练数据,支持模型的大规模预训练。
- 指令驱动:模型能接收自然语言指令,解析指令内容,生成相应的操作序列,实现指令跟随功能。
InternVLA·M1的项目地址
- 项目官网:http://internrobotics.github.io/internvla-m1.github.io/
- Github仓库:http://github.com/InternRobotics/InternVLA-M1
- HuggingFace模型库:http://huggingface.co/collections/InternRobotics/internvla-m1-68c96eaebcb5867786ee6cf3
- HuggingFace数据链接:http://huggingface.co/datasets/InternRobotics/InternData-M1
- 技术论文:http://github.com/InternRobotics/InternVLA-M1/blob/InternVLA-M1/assets/InternVLA_M1.pdf
InternVLA·M1的应用场景
- 工业自动化:在工厂环境中,用于自动化生产线上的复杂任务,如零部件组装、物料搬运和质量检测,提高生产效率和精准度。
- 物流与仓储:优化物流中心的货物分拣、搬运和存储操作,实现自动化仓库管理,提升物流效率和准确性。
- 服务机器人:在家庭、酒店、医院等场景中,为人们提供清洁、送餐、护理等服务,提升生活质量和服务效率。
- 智能安防:用于安防监控中的异常行为检测、区域巡逻和安全检查,增强安防系统的智能化水平。
- 教育与科研:作为教学和科研工具,帮助学生和研究人员探索机器人技术、人工智能和自动化控制等领域。
-
灾难救援:在地震、火灾等灾害
现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。
- 农业自动化:用于农作物种植、采摘和灌溉等环节,实现农业生产的自动化和智能化,提高农业生产力。
以上就是InternVLA·M1— 上海AI Lab开源的具身双系统操作大模型的详细内容,更多请关注其它相关文章!
# 开源
# 湖州网站建设代运营公司
# 宜春seo优惠
# 藤桥网站建设
# 雅安企业网站推广服务
# 广东seo软件厂家排名
# 营销推广月度总结报告
# 广州天河定制网站建设
# 网站推广软件_yangzai231030
# 网站推广分享赚钱工具
# 傻SEO佬
# 一键
# 未见
# 适用于
# git
# 安防
# 自主学习
# 双系统
# 长程
# 闭环
# 机器人技术
# 上海
# 大模型
# pdf
# ai
# 工具
# 人工智能
# github
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
如何知道固态硬盘
65寸电视长宽多少厘米
如何自己加装固态硬盘
solidworks打开IGS文件作图教程
市盈率回落是什么意思
混合固态硬盘如何分区
折叠屏手机哪个有性价比
单片机怎么进行排序操作
debian10和ubuntu20哪个好用
苹果16送哪些配件
j*a怎么讲数组打印
固态硬盘如何保存
春运提前抢票攻略
360n4怎么关闭锁屏壁纸
如何显示固态硬盘
hive中datediff函数怎么用 Hive中DATEDIFF函数的使用指南
买的5g手机但是没有5g网络怎么办
j*a数组怎么取元素
如何看固态硬盘型号
51单片机怎么用flash
ao3镜像网站永久地址入口
如何安装台式机固态硬盘
sql isnull函数如何使用
夸克是什么用途
域名批量查询工具有哪些
2025年哪个局域网聊天软件好用
bugly是什么
typescript什么意思
typescript适合什么用
苹果16最近玩法有哪些
sausage是什么意思
手机的nfc是什么功能是什么意思
如何看固态硬盘信息
商誉是什么意思
typescript和es6先学哪个
春运什么时候开始抢票
光猫power灯一直闪是什么意思
怎么把手机里爱奇艺的视频下载到u盘里
如何修改cad中的命令
typescript书籍哪个好
雅迪电动车上的power是什么意思
苹果16如何预购
j*a怎么保存到数组
国标控制器单片机怎么接线
2025年国外最佳语音聊天软件排行榜
固态硬盘颗粒如何修理
显示器的power是什么意思
如何查看网站域名解析
i5 6500怎么装win7
固态硬盘内存如何查找


2025-09-18
浏览次数:次
返回列表
现场,执行搜索、救援和物资运输任务,减少人员伤亡和提高救援效率。