机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

1,092次阅读
没有评论

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

进宝马工厂用了12个月

好家伙!

机器人已入厂打工分拣快递,手法娴熟和人类一模一样。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

前几天,Figure推出了端到端通用控制模型——Helix,能让机器人像人一样感知、理解和行动。

现在,是时候检验最新成果了。

视频中,一批Figure 02走上生产一线,秩序井然地分拣快递,还能正确调整条形码位置以供机器扫描……

最重要的是,按照官方说法,此次场景微调只用了30天。而作为对比,第一个客户案例用了12个月之久。

端到端学习方法让Figure的机器人能够快速学习新任务!

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

面对如此进化速度,网友们直呼:我们完啦!

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

背后关键:改进了Helix系统1

除了视频,针对本次实验的高速、小包装物流场景,Figure还公开了Helix进展的最新报告

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

在和OpenAI断交之后,就在上周五,Figure公布了首个成果Helix

作为一个端到端通用控制模型,只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西(比如这个活泼的小仙人掌)。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

更有意思的是,两个机器人也可以共同协作,而且用的是同一组神经网络

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

根据当时的介绍,Helix主要由两个系统组成,两个系统经过端到端训练,并且可以进行通信。

  • 系统1:80M参数的交叉注意力Transformer,用于处理底层控制
  • 系统2:基于在互联网规模数据上预训练的7B开源VLM,用于场景理解和语言理解。
机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

而这一次,Figure在物流场景重点对系统1(底层控制)进行了一系列改进

1、隐式立体视觉(Implicit stereo vision):增强了3D空间感知,使机器人动作更精准;

2、多尺度视觉表示(Multi-scale visual representation):结合细节和整体场景理解,提高操作精度;

3、学习视觉本体感知(Learned visual proprioceptio):每个Figure机器人现在都可以自我校准,简化跨机器人技能迁移;

4、运动模式(Sport mode):使用简单的test-time加速技术,同时保持高成功率和更快的执行速度。

最重要的是,Figure针对该特定场景,进一步探讨了数据质量和数量之间的权衡关系,并初步发现:

仅用8小时精心挑选的数据就能训练出一个灵活且适应性强的策略

下面具体展开。

在物流场景下,关键环节包括包装处理和分类,主要是需要将包裹在传送带上转移并确保标签正确扫描。

听起来是不是很简单,但如果要让机器人取代人类来完成这项工作,面临的挑战在于:

包裹的尺寸、形状、重量等各异,机器人不仅要能拿起来,而且需要确定最佳抓取和转移时间,甚至放错了之后还能立马纠正。

为了实现上述目标,Figure首先改进了Helix系统1的视觉能力

新一代系统1通过采用立体视觉骨干网络和多尺度特征提取网络来增强其空间理解能力。

简单说,系统不再独立处理来自每个摄像头的图像特征,而是首先在多尺度立体网络中合并两个摄像头的特征,然后再进行标记化(Tokenize)处理。

这样做的好处是,保持了输入到交叉注意力transformer的视觉tokens总数不变,避免了计算开销。

同时,多尺度特征提取网络能够同时捕捉到细节和更广泛的上下文信息,这有助于提高操作的准确性和可靠性。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

此外,为了解决在多个机器人上部署统一策略时遇到的挑战,以及如何通过在线自我校准来实现跨机器人策略迁移。

例如由于机器人硬件差异导致的观察和动作空间的分布偏移,传统的手动校准方法不适用于大规模机器人群体。

Figure训练了一个视觉自体感觉模型(visual proprioception model),这个模型可以让每个机器人通过自身的视觉输入来自我校准,估算出机械臂末端(即抓取物体的部分)的精确位置和姿态。

并且这种自我校准是在线进行的,也就是说机器人可以在工作的同时进行校准,这样就能最大程度地减少因校准而需要停止工作的时间

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

顺便一提,训练过程中,Figure排除了那些较慢的、遗漏的或失败的案例,不过特意保留了包含纠正行为的案例(非遥控操作员导致,自然产生)。

最后,为了达到并超过人类的操作速度,Figure采用了一种被称为“运动模式”的test-time加速技术。

具体来说,他们让系统1以每秒200次的频率输出一系列动作,这些动作被称为动作“块”(action “chunks”)。

然后采用了一种插值方法来加速这些动作块的执行。插值是一种数学方法,可以在原有数据点之间生成新的数据点。在这里,他们将原本的动作块(比如代表T毫秒的动作)通过插值缩短为0.8T毫秒的动作块,但是仍然以每秒200次的频率执行这些缩短后的动作块。

这种方法不需要改变机器人的训练过程,只是在test-time对动作执行进行加速。通过这种方法,Figure机器人能够在实际测试中实现高达20%的速度提升。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

Figure创始人:未来四年交付10万台

总之,技术升级让Figure走进工厂的速度更快了。

官方提到的第1个客户,应该是指去年8月发布的Figure 02进宝马工厂从事汽车装配的事儿。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

当时宝马工厂花了12个月才给机器人安排好合适的工作,而这一次,机器人正式上岗物流仅用了30天时间。

也难怪Figure创始人有底气宣布,未来四年要交付10万台人形机器人

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

另一方面,随着国内外各家机器人纷纷“进厂打工”,大家逐渐达成了一个共识:

2025是机器人量产关键之年

从各家demo来看,人形机器人的技术已基本成熟,因此接下来的争夺主要围绕量产展开,而且要往实际生产场景走了。

比如在一家上海机器人工厂内,大批“未来工人”正在生产ing。

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

嗯,都卷起来吧!

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 2 月
 12
3456789
10111213141516
17181920212223
2425262728  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...
英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货 十三 2026-01-06 13:54:54 ...
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...