新闻中心
OpenAI大模型上身机器人,原速演示炸场!
openai大模型加持的机器人,深夜来袭!
名曰Figure 01,它能听会说,动作灵活。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
能和人类描述眼前看到的一切:
我在桌子上看到一个红色的苹果,沥水架上还摆放着几个盘子和一个杯子;你站在旁边,双手轻轻放在桌子上。
图片
听到人类说“想吃东西”,就马上递过去苹果。
图片
而且对于自己做的事有清楚认知,给苹果是因为这是桌上唯一能吃的东西。
还顺便把东西整理,能同时搞定两种任务。
图片
最关键的是,这些展示都没有加速,机器人本来的动作就这么迅速。
(也没人在后面操纵)

这下网友坐不住了,立马@波士顿动力:
老伙计们,这家伙是真来劲儿了。咱得回实验室,让以前的机器人(波士顿动力)多跳点舞了。
图片
也有网友看在OpenAI卷完大语言模型、文生视频之后,又狙击机器人后感慨道:
这是一场激烈的竞争;与OpenAl合作,苹果可能会超越特斯拉。
但硬件方面,擎天柱看起来更美观,Figure 01仍然需要一些“整容手术”。(doge)
图片
接下来,我们继续来看下Figure 01的细节。
OpenAI视觉语言大模型加持
根据创始人的介绍,Figure 01通过端到端神经网络,可以和人类自如对话。
基于OpenAI提供的视觉理解和语言理解能力,它能完成快速、简单、灵巧的动作。
模型只说是一个视觉语言大模型
,是否为GPT-4V不得而知。
图片
它还能规划动作、有短期记忆能力、用语言解释它的推理过程。
图片
比如对话里说“你能把它们放在那里吗?”
“它们”、“那里”这种模糊表述的理解,就体现了机器人的短期记忆能力。
它使用了OpenAI训练的视觉语言模型,机器人摄像头会以10Hz拍下画面,然后神经网络将以200Hz输出24自由度动作(手腕+手指关节角度)。
具体分工上,机器人的策略也很像人类。
Yaara
使用AI生成一流的文案广告,电子邮件,网站,列表,博客,故事和更多…
95
查看详情
复杂动作交给AI大模型,预训练模型会对图像和文本进行常识推理,给出动作计划;
简单动作如抓起塑料袋(抓哪里都可以),机器人基于已学习的视觉-动作执行策略,可以做出一些“下意识”的快速反应行动。
同时全身控制器会负责保持机身平衡、运动稳定。
图片
机器人的语音能力则基于一个文本-语音大模型微调而来。
图片
除了最先进的AI模型,Figure 01背后公司——Figure的创始人兼CEO还在推文中提到,Figure方面整合了机器人的所有关键组成。
包括电机、中间件操作系统、传感器、机械结构等,均由Figure工程师设计。
据了解,这家机器人初创公司在2周前才正式宣布和OpenAI的合作,但才13天后就带来如此重磅成果。不少人都开始期待后续合作了。
图片
由此,具身智能领域又有一颗新星走到了聚光灯下。
“将人形机器人带进生活”
说到Figure,这家公司创立于2025年,正如前文所言,再次引爆外界关注,就在十几天前——
官宣在新一轮融资中筹集6.75亿美元,估值冲到26亿美元,投资方几乎要集齐半个硅谷,包括微软、OpenAI、英伟达和亚马逊创始人贝佐斯等等。
更重要的是,OpenAI同时公开了与Figure更进一步合作的计划:将多模态大模型的能力扩展到机器人的感知、推理和交互上,“开发能够取代人类进行体力劳动的人形机器人”。
用现在最热的科技词汇来说,就是要一起搞具身智能。
图片
彼时,Figure 01的最新进展是酱婶的:
通过观看人类的示范视频,仅需10小时端到端训练,Figure 01就能学会用胶囊咖啡机泡咖啡。
图片
Figure与OpenAI的合作一公开,网友们就已经对未来的突破充满了期待。
图片
毕竟Brett Adcock,可是把“唯一的重点是以30年的视角建立Figure,以积极影响人类的未来”这样的话都写在个人主页上了。
但可能没人能想得到,仅仅两周左右的时间,新进展就来了。
如此之快,如此之远。并且还能持续泛化、扩展规模。
图片
值得一提的是,与炸场demo同时发布的,还有Figure的招聘信息:
我们正在将人形机器人带进生活。加入我们。
图片
参考链接:
[1]https://www.php.cn/link/59bbfbe0d3922ccd1d167661a26d8353
[2]https://www.php.cn/link/a3fc34dce15cda93287496c84af5203c
[3]https://www.php.cn/link/194585b5215aea447389c5fefca09c61
以上就是OpenAI大模型上身机器人,原速演示炸场!的详细内容,更多请关注其它相关文章!
# openai
# 螺蛳粉营销推广摘要范文
# 可直接
# 新能源
# 这家
# 日韩
# 还能
# 放在
# 省电
# 波士顿
# 的是
# fig
# follow
# 机器人
# 模型
# 这是
# 海口网站建设方案推广
# 陕西抖音关键词排名平台
# 社群营销推广方案 精品
# 酸奶营销推广
# 芒果营销怎么做推广好呢
# 大连网站建设手机版
# 南京谷歌seo网站推广
# 辉县网站建设优化推广
# 方山信息化网站推广一般多少钱
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
苹果16讲解有哪些功能
苹果手机16系统有哪些
苹果16配置参数有哪些
苹果16系统有哪些功能
点焊机接触器上power是什么意思
如何查询固态硬盘寿命
手机换电池要多少钱
为什么夸克书架书单没了
建伍遥控器power是什么意思
j*a中数组怎么传递
j*a 怎么清空数组元素
固态硬盘内存如何查找
春运抢票要用抢票软件吗
win10电脑如何使用命令提示符
春运哪天抢票最好
破太岁是什么意思
一天多少分钟
如何使用net命令
vfp 命令窗口如何实现换行
sofa是什么意思
春运车票啥时候可以抢票
5g手机怎么没视频通话功能
台达plc只有power灯亮是什么意思
学typescript有什么用
春运抢票需要什么软件抢
ping命令如何看问题
哪些框架支持typescript
单片机学习视频怎么调色
硬盘和固态硬盘如何区分
春运抢票用不用取票码
j*a数组求和怎么算
如何显示固态硬盘
如何打开命令提示符
壁挂炉power常亮是什么意思
苹果16系统网站有哪些
performance是什么意思
如何选择启用固态硬盘
电信开通nfc功能是什么意思
固态硬盘如何拆除
苹果电脑如何输入命令
春运抢票准备什么东西
阿里云盘的会员怎么用
路亚竿上的power是什么意思
为什么要用typescript6
夸克是什么空间单位
折叠屏手机哪个卖得最好
j*a怎么让数组倒换
春运抢票最好抢什么票啊
硬件如何执行命令
typescript需要学多久


2024-03-15
浏览次数:次
返回列表