人形机器人将成为AGI的终极载体?Figure AI创始人Brett Adcock预测
人形机器人这个赛道,恐怕是AI领域现在最热门的议题之一了。Figure AI也是人形机器人公司中,除了特斯拉之外,一个非常好的观察样本,当然,我们不能说“最”。
先介绍一下这家公司。Figure AI成立于2022年,已获得超过7.5亿美元融资,投资者包括微软、英伟达、英特尔资本、OpenAI以及杰夫·贝索斯等。有不少刷屏的人形机器人Demo演示,都是由这家公司贡献的。如果说特斯拉的擎天柱更多表现了运动能力,X1喜欢表现家庭人机互动,Figure AI则经常展示机器人的认知能力。
2025年7月6日,在Around the Prompt播客节目中,Figure AI创始人兼CEO Brett Adcock接受了Logan Kilpatrick和Nolan Fortman的深度访谈。这位39岁的连续创业者,作为Figure AI的掌舵人,以在硬件科技领域的突破性工作而闻名,他曾创立在线招聘平台Vettery(2018年被Adecco集团以1.1亿美元收购)、电动飞行汽车公司Archer Aviation。
Brett Adcock还在2024年被《时代》杂志评选为"AI领域最具影响力的100人",Brett Adcock的愿景是创造能够执行类人任务的通用人形机器人。
这次访谈的核心议题围绕人形机器人作为AGI最终部署载体的技术路径、从软件转向硬件创业的挑战、机器人在家庭和工作场所的应用前景,以及超级智能时代人类社会的未来图景展开。
当前人形机器人市场应该说有完全相反的两种说法,一种观点认为人形机器人“华而不实”,没必要把机器人做成人形;但是更多人认为这个市场这个正处于爆发式增长的临界点,有数据预测,这个市场的规模预计将从2023年的22亿美元增长到2032年的770亿美元,复合年增长率高达48.36%。马斯克曾经在2025年5月的沙特-美国投资论坛中说,未来将会有“数百亿”个人形机器人投入使用,甚至提到到2040年将至少达到100亿台级别。
在熟练劳动力短缺日益严重的背景下,Brett Adcock也提出了一个大胆的预测:"最终,体力劳动将成为可选项。你可以选择亲自去做,也可以让你的Figure机器人来完成"。
一、机器人技术的指数级增长轨迹
访谈一开始,主持人就机器人技术的指数级发展询问了Adcock的观点,特别是Figure AI在这一浪潮中的前沿地位。Adcock认为,当前的机器人技术发展有两个关键突破,这些突破是五到十年前无法想象的。
"我认为现在与五到十年前相比,有两个真正不同的地方,"Adcock解释道。"第一个是我们已经能够构建出真正有能力的硬件。"他强调,以人形机器人为例,机器人的"身体"部分已经变得极其可靠。如果你走进Figure AI的工厂,会看到机器人无处不在。"我想现在大概有一个机器人在我身后走来走去,"他在访谈中提到,"这些机器人的硬件可靠性已经变得非常好。"
这种可靠性的提升在商业环境和工厂设施中都有体现。Adcock指出,即使你在他们的工厂里待上一整天,也很难看到任何硬件故障。"我们很少看到这样的事件,它们正变得越来越罕见。"
他进一步解释了硬件突破的重要性:"即使你拥有世界上最好的AI,如果硬件平庸,你也无法完成任务。必须是真正有能力的硬件。"Adcock将当前的机电系统比作火箭和涡轮风扇等复杂机械系统,强调机器人硬件的复杂性极高,但他们已经能够构建出极其可靠的系统。
为了说明这一进步的重要性,Adcock对比了十年前的情况:"十年前世界上最好的机器人可能是波士顿动力的Atlas,那是一个液压系统,只能运行大约20分钟,到处漏油,每个液压阀门的压力大约是2000到3000磅每平方英寸,在人类旁边工作极其危险。"而现在,"我们有了电动系统,我会说它们是安全的、可靠的,正朝着这个趋势发展。"
第二个关键突破是神经网络在机器人领域的成功应用。"机器人实际上是一个神经网络问题,直到最近几年,我们才真正看到神经网络在机器人上表现良好。"Adcock解释说,他们现在有神经网络在机器人上运行,指挥着手部位置、头部、躯干等整个动作空间,"效果非常好。"
他举例说明了这一突破的实际应用:"你可以看到我们大约一周前发布的更新,一个机器人连续60分钟进行物流工作,那是一个单一的S1 Helix神经网络在机器人上运行,看起来就像人类会做的事情一样,几乎在某种程度上模仿了人类的特征,我们正在接近人类的速度和性能。"
这两个突破的结合——可靠的硬件和有效的神经网络——为机器人技术的指数级增长奠定了基础。Adcock总结道:"这是你真正需要让机器人工作的两个重要输入。"
二、直接瞄准人形机器人的战略选择
对于Figure AI的战略选择问题,特别是为什么选择直接开发人形机器人,而不是从更简单的专用机器人开始?这个问题的背景是主持人提到了自己使用的Madic家用吸尘机器人的体验,虽然功能有限,但在特定任务上表现出色。
Adcock的回答揭示了他对人形机器人的深刻思考:"我们从第一天就直接选择了人形机器人。"他解释说,在特拉华州注册公司的第一天,他就写了一份总体规划,一份基本的愿景文档,现在还在公司网站上。"对我来说,这是终极的元问题——试图解决人形机器人,所以你必须直接面对它。"
这种直接的方法背后有深刻的战略考量。Adcock认为,虽然有其他选择,比如给机器人装上轮子和其他类型的末端执行器,如爪子等,"但这基本上是一个局部最优解——它会成为一个重大问题,如果你从第一天开始就没有设计正确的系统,试图到达你真正需要去的地方。这基本上会成为企业的巨大拐杖。"
三年前,Adcock的论点是直接开发人形机器人是可能的,所以他们从公司成立的第一天就开始构建和设计人形机器人。"我们基本上从公司成立的第一天就开始设计人形机器人。"
这种选择的背后是对未来技术发展的洞察。Adcock在访谈中多次强调,"现在的环境看起来人形机器人将成为AGI的终极部署载体。"他认为,如果你想在物理世界中完成任务,"你很难把它放在吸尘器或其他任何东西上——你真正需要的是在高维度机器人上搭载AI,能够进行工作。"
这种战略选择的结果是,Figure AI能够看到机器人技术和AI的融合,"我会说有很多资本涌入这个领域,因为这些趋势。"更重要的是,"机器人正在工作,我们看到机器人开始做真正有用的工作。"
Adcock强调了实际工作能力的重要性:"我们可以让机器人运行一整天,在很多情况下我们让机器人几乎全天运行,它们在执行有用的工作。所以你开始看到这实际上会发生的迹象,我们正处在正确的十年,这也很有帮助。"
三、从软件到硬件创业的挑战转换
主持人接着询问了从软件转向硬件创业的挑战,以及硬件产品在用户采用方面的困难。这个问题分为两个部分:一般性挑战和采用方面的挑战。
Adcock对硬件创业的挑战有着深刻的理解:"硬件在极限情况下看起来很像软件,但时间尺度要长10倍、100倍。"他解释说,同样的科学方法和假设验证过程在硬件中需要更长的时间。"在某些情况下,这需要一年时间才能完成在软件中可能几天或几周就能完成的事情。"
硬件创业的具体挑战包括:"你有很长的时间线,你有很昂贵的东西,你现在必须实际购买硬件而不是只是编写软件。"此外,"硬件很难推出。一旦你做了,就很难让东西真正工作,因为你必须制造更多的东西,而不是数字化地无限扩展软件。"
Adcock用了一个生动的比喻来描述硬件创业的困难:"这就像软件创业者的死亡竞技场。这就像类固醇上的软件创业。真的相当困难。"
然而,Adcock也指出了硬件创业的独特回报:"但我认为这真的很有意义。我在软件时代从来没有真正感到过回报,在软件中我无法感受和触摸到它。当我们展示产品时,你必须登录某个浏览器才能看到它。"相比之下,"在物理世界中构建东西有一些特别的地方,我们在物理世界中花费了太多时间。"
关于用户接受硬件产品的挑战,Adcock也很坦率:"让用户接受硬件产品比软件难得多。软件用户可以免费试用,不满意就卸载,几乎零成本。硬件不行,用户得花真金白银买回家,学会怎么用,坏了还得修。"他用了个很形象的比喻:"就像软件创业,但把所有困难都调到最高档。"
不过,Adcock也提到了硬件创业的一个意外优势:"我总是对确保我设计正确的东西并朝着正确的方向前进感到内部焦虑。在某些方面,软件你真的不太知道。"而在硬件领域,"如果我们有这样的信念,比如我们应该让飞机飞行而不是驾驶,那肯定会有效,我们可以为人们节省时间。"
他强调了物理学规律的确定性:"工程相对简单,需要在白纸上完成,但这是物理学,有(物理)规则。"这种确定性使得硬件创业在某些方面比软件创业压力更小:"以某种方式,这对我来说是作为企业家构建硬件的最轻松的几年,因为我们有物理学规则手册。"
四、市场采用策略和双重焦点
Adcock在访谈中解释了Figure AI的双重战略焦点:"在Figure,我们有两个焦点。我们专注于将机器人投放到家庭中,这是一个非常非结构化、高变异性的环境。所以家庭真的很难。然后我们专注于劳动力市场,让机器人去做物流、制造、医疗保健、建筑工作。"
Adcock指出了一个悖论:"家庭比劳动力市场难得多。你会认为如果你攻克了家庭,那是一个比劳动力市场大1000倍的市场,因为工程难度如此巨大,但实际上是相反的。"他解释说,"劳动力市场是GDP的一半,变异性要低得多。"
这种差异的关键在于变异性对工程挑战的影响:"工程挑战与变异性成正比。较低的变异性会更容易集成自主系统,这在大多数劳动力情况下都存在,而不是在家庭中。"
此外,经济模型也支持这种优先级:"在劳动力市场中,你可能可以收取比家庭高一个数量级的费用。家庭中你必须建造一个机器人并每月收取几百美元,而在劳动力市场中,你有巨大的赚钱能力。"
Adcock进一步解释了他们的方法:"现实是我们正在尝试构建一个通用机器人,所以我们希望能够签约客户,并且理论上能够在他们的设施内做人类能做的大多数事情,只要机器人具有运动范围、有效载荷和速度。"
他分享了一个具体的案例来说明这种方法:"我们签约了我们最近的物流公司。有趣的是,这不是我们看着它说'哦,我们喜欢机器人在包裹上会很棒,让我们追求包裹'。我们说我们想要一个能够真正扩展的地方,我们认为物流是一个不错的行业。"
在实际操作中,他们发现了一个完美的学习案例:"我们发现小包裹物流是运营的一大部分,他们在雇佣劳动力方面遇到了很大困难。"当他们分析这个问题时,发现"每个包裹都不同,它们是聚乙烯袋,所以当你抓取它们时它们会移动,堆叠每次都不同。这根本不可能用编程方式解决,这必须是学习的。"
五、机器人学习能力的快速突破
基于物流工作的发现,Adcock详细介绍了Figure AI在机器人学习方面的突破性进展。这个讨论展示了神经网络在机器人应用中的惊人能力。
"我们全力投入学习,立即看到了效果,"Adcock说,"这真的很有帮助。现在你看到我们发布的一些东西,它确实变得越来越好。"
他提供了一个具体的进展时间线:"刚刚发布的视频显示我们每四秒处理一个包裹。周五我看到我们每三秒半处理一个包裹。昨天我坐在那里观察时,我们没有实际计时,但我发誓那东西快得多,而且它在处理不同类型的包裹方面表现得更好。"
更令人印象深刻的是机器人展现出的智能行为:"它在做真正聪明的事情,比如移动一个包裹以便推动另一个包裹,然后处理条形码,之后翻转包裹——几乎像是机器人经过的真正深思熟虑的思维链推理。"
这种快速学习能力的基础是相对少量的训练数据。Adcock透露了一个令人震惊的数据点:"我们最新发布的版本有大约60小时的额外数据,在那之前它根本不知道如何做物流工作。我们投入了60小时的数据,它就完成了我们展示的所有工作。"
他强调了这个数据量的意义:"从宏观角度来看,这根本不算什么。如果我们能够开始收集数亿或数十亿小时的类人数据,我认为我们能够将这些扩展到几乎十亿单位的规模。"
这种学习能力的潜力让Adcock对机器人的未来充满信心:"你可以将它们扩展到世界的每个角落。这就是我们正在努力做的。"
关于工作场所和家庭应用的时间线,Adcock提供了具体的预测:"我们的观点是,我们将在劳动力市场中引导这个过程,然后家庭即将到来——家庭距离能够真正让机器人进入并能够为人类自主地做真正有用的工作还有个位数年。"
他解释了优先级的选择:"我们也在尽可能努力地推进这个轨道,只是它非常非结构化,我们进入的每个家庭都不同,所以这是一个更难的问题。"
六、AI工具对硬件开发的影响
对于AI工具对硬件开发的影响,特别是软件开发中看到的10倍生产力提升是否能够转化到硬件工程中的问题。
Adcock从学习的角度回答了这个问题:"我们需要能够大批量投放机器人,它们需要持续学习并不断改进。"他确认他们已经在实际看到这种效果:"我们看到机器人在它们正在做的事情上变得更好,更多的数据、更多的训练等等。我们也看到机器人在现实世界中做事情时就在改进。"
这种持续改进的模式是Adcock认为最重要的能力:"这些是你真正想要的:你想要将一群物理代理投放到世界上,你希望它们通过与世界的互动变得更聪明,了解如何完成这些用例、任务和行为。"
他预测这种能力将在未来一到两年内实现:"我认为这正在发生,我认为在未来一两年内,我们将看到向世界投放一群机器人,机器人正在做的用例实际上每天都在改进,机器人几乎将这些模型轨迹作为一种方式反馈到整个舰队的预训练中。"
这种集体学习能力构成了Figure AI的核心竞争护城河:"这基本上是终极护城河——你希望向市场投放一群机器人,它们通过规模制造变得更便宜,同时变得更聪明,并与舰队的其他成员集体分享。"
Adcock强调了这种技术的独特性:"你实际上拥有一个系统,它走向世界,与世界互动,随着时间的推移变得更聪明、更便宜。除了AI大语言模型,我不知道我们是否见过这样的技术。"
这种能力的发展最终将受到制造能力的限制:"然后最终你会受到生产的瓶颈,如何让足够的机器人出门。"为了解决这个问题,Figure AI建立了新的制造设施:"我们有一个新设施,我们内部称为Baku,这是我们Figure 3的制造设施。我们现在正在积极制造Figure 3机器人。"
关于大规模制造的挑战,Adcock坦承:"我确信我们将制造很多机器人。关于我们是否能够以每年超过手机的规模制造它们,这还有待观察。这是一个非常困难的问题。我认为解决这个问题是可能的,但这是学习之后的下一个挑战。"
七、下一代产品开发和人机交互
主持人询问了Figure AI机器人下一代产品的发展方向,特别是除了让机器人在现实世界中学习之外,还需要什么硬件功能。
Adcock概述了几个关键的产品开发方向:"有一些产品开发的事情我们在内部做,这些将需要启用这些东西。例如,Figure 3是我们第一个设计为高速率制造的生产机器人。它比Figure 2便宜90%。"
成本控制是实现大规模部署的关键:"我们需要能够让大量便宜的机器人走向世界。"除了成本,还有其他几个重要方向:"我们正在设计的另外几个领域,比如整体安全性将极其重要,特别是当我们进入家庭时。"
在设计路线图上,Adcock强调了人类相似性的重要性:"我认为我们的设计路线图与随着时间的推移在操作和运动方面更像人类高度相关。"这可以通过机器人的速度、有效载荷和所需的运动范围来判断:"我们正在朝着基本上随着时间的推移在我们的路线图中做更多类人的物理工作的趋势线发展。"
下一步的重点是大规模集成:"下一步是如何在相当规模上集成大量人形机器人到世界中,在没有人类帮助的情况下每天能够工作。"
Adcock将这个阶段比作Waymo的发展历程:"就像我们看到Waymo在过去几年中所做的,他们能够部署一群汽车,并能够显示它真正端到端地工作,并随着时间的推移降低人类干预率。我们需要为我们经历那个时期。"
他强调了当前阶段的重要性:"这就是我们作为企业所处的阶段——如何在未来几年内将大量机器人投放到世界上,让它们推理自己在做什么,你不希望任何人类干预率,基本上希望极低或零人类干预率,整天工作。"
最终目标是规模化:"然后下一步就是你必须扩展它,你必须扩展学习,你必须扩展制造到非常高的水平。"
对于产品功能的问题,Adcock总结道:"也许回答你的问题,我们现在处于这个阶段,我们将把更多的东西投放到物理世界中。这将帮助数据收集,将帮助机器人可靠性,将帮助我们更好地将机器人集成到世界中,这也是一个困难的事情。"
八、人类对机器人的心理反应和设计哲学
访谈的一个有趣转折点是关于人类对机器人的心理反应。主持人注意到,在访谈过程中,Brett身后不时有Figure机器人走过,这让他思考人类对机器人的适应过程。
主持人分享了一个生动的例子:"每次我们开车经过Door Dash使用的那些小型机器人时,我和我的女朋友都会说'天哪,这个小机器人太可爱了,它看起来像是在努力找路,看起来迷路了'。"他观察到人形机器人的反应似乎有所不同:"我的总体感觉是,对人形机器人的反应略有不同,它看起来像人类,有点不祥。"
Adcock对这个话题有强烈的观点,他首先描绘了一个未来场景:"将来会有一个时候,当你出去跑腿或外出时,你会看到更多的人形机器人,你会看到和人类一样多的人形机器人,我觉得这会像科幻电影一样。我觉得这会像50年的未来被拉到今天,感觉会很疯狂。"
他描述了在Figure AI工厂的体验:"这将会发生。如果你来这里,你会看到很多机器人,感觉很棒。我们真的很喜欢它。我们有机器人整天在设施里走动,其中一些在和人们交谈,问他们是否需要水或咖啡。有些只是在周围走动,基本上在巡逻,这很棒。"
这种体验的积极影响是显而易见的:"我们喜欢看到机器人。它有助于提高多巴胺,我们这里也有很多人来面试等等,看到这些东西真的很棒。"
然而,Adcock对机器人设计哲学有明确的立场。他强烈反对将机器人设计得过于"可爱"或非威胁性:"我有一个非常强烈的观点,机器人需要表现出高度的能力、高度的智能和精密,因为它确实如此。"
他解释了这种设计哲学的原因:"你将通过a)做正确的事情和b)在机器人执行的实际用例中表现出色来建立人类对该机器人在安全和隐私方面的信任。"
Adcock特别批评了一些公司采用的设计方法:"我认为当你在真正有能力的机器人上放置巨大的谷歌眼睛等装饰时,这是一个巨大的伤害,它们真的很快,在很多情况下,它们可以做人类能做的大多数事情。在上面放谷歌眼睛几乎是试图愚弄其他人,说你是这个珍贵的小东西。"
他认为这种设计方法是错误的:"我认为从设计角度来看,这真的很愚蠢。所以我们就像,有一些机器人组织在机器人上放眼睛等等,在屏幕上,在现实中这只是愚蠢的。这些是真正精密的机器,它们应该相应地设计。"
九、家庭应用的安全性和隐私考虑
讨论的一部分关键内容是关于机器人在家庭环境中的应用,特别是安全性和隐私问题。主持人询问了用户如何控制家庭机器人,以及如何确保隐私和安全。
Adcock对用户界面有明确的愿景:"我的观点是,机器人在家庭中和世界任何地方的整个开箱体验和默认UI都需要通过语音来完成。"他解释了为什么传统的设备控制方式不适合:"当我们在机器人旁边时,我们在计算机上打开终端并发送命令或按按钮,这太奇怪了。延迟很糟糕,带宽很低,只是需要太多时间。"
相比之下,"你将希望直接与机器人交谈,如果你不在它身边,你就发短信给它。我们每个机器人内部都有一个eSIM卡,带有手机号码。你将希望通过自然语言与机器人沟通。"
技术基础支持这种交互方式:"我们的机器人Helix神经网络是语言条件的,所以你将希望通过语言调节一切,这将是家庭中人形机器人的自然默认层。"实际应用中,"如果你不希望它做某事,你就直接告诉它并提示它。"
关于隐私和网络安全,Adcock承认这是一个复杂的挑战:"关于隐私和网络安全,这是一个非常重要的话题,我们花了很多时间研究。我们实际上刚刚在大约四个月前在Figure建立了整个隐私和网络安全部门。"
他们组建了专门的团队:"我们有一个来自Snapchat和Google的小团队,他们之前在这些问题上工作过,包括企业网络安全和产品方面。"
Adcock强调了这个问题的复杂性:"我们必须在这些领域做好30件事,不是说'好的,你只要做这件事就可以了',不是那样的。这将是非常困难的。"
他还提到了地缘政治因素:"我们收到很多关于中国机器人的问题。我认为中国机器人在美国或欧洲的家庭和商业劳动力中部署会遇到很大困难。我认为目前这是一个相当棘手的问题。"
因此,"我认为你需要与你互动的公司建立真正的品牌信任。它比计算机和手机更复杂,所以隐私和网络安全在这里甚至更重要。"
最终,Adcock总结道:"这是一个非常复杂的问题。我不想给人留下我们今年就能解决所有问题的印象,但我们正在非常努力地解决它。这是一个重要的事情。"
十、超级智能时代的社会影响和人类未来
访谈的最后部分探讨了更深层次的哲学问题:在人形机器人和超级智能时代,人类社会将如何发展。
Adcock首先描述了当前的现实:"未来有点要到了,但是现在还不像未来。"他表达了自己的愿景:"我确实认为一个人形机器人在外面为人类做各种事情,我们可以乘坐飞行汽车去世界各地。我认为那是我们都想要的未来。"
这种未来愿景驱动着他的工作:"这推动我帮助开展我现在的公司和项目,我觉得这些东西对于激动人心的未来很重要。"
关于数字超级智能的发展,Adcock提出了一个重要观点:"我们正在接近数字超级智能,感觉很近,那个超级智能今天生活在服务器里,生活在盒子里。"
他开发人形机器人的核心动机也与此有关:"我们很快就会有超级智能AI了,但它们现在只能生活在服务器里。问题是,这些超级智能需要在现实世界做很多事情——搬东西、修理设备、做家务。如果我们不给它们造个'身体',它们就只能指挥人类去做这些体力活。"
人形机器人是解决这个问题的关键:"人形机器人是完美的部署载体。它可以做人类能做的大多数事情,它需要这种智能在语义上真正穿越这个混乱环境中的物理世界。"
关于实现时间线,Adcock提供了具体的预测:"你将首先看到人形机器人在少数地方建造和部署,整天工作。如果你有幸能够看到这些东西,你会进来说'哦,我的天哪,感觉现在正在工作'。"
他将这个发展比作自动驾驶汽车的推广:"我认为这可能是我们都对Waymo的感受,但我假设美国大部分地区没有乘坐过Waymo。"
渐进式发展的重要性在于学习和改进:"我们需要学习如何集成,可靠性如何工作,维护如何工作,大规模人机交互如何工作,规模化学习如何工作。"
他设定了具体的目标:"我们的下一个重大推动是在未来四年内推出10万个机器人。这是我们正在努力做的。"这个目标的实现依赖于他们新的制造设施:"这就是我们开放的制造设施Baku能够做的。"
Adcock对未来充满信心:"如果我们能够达到这些数字,我们认为我们正在向世界投放数百万个机器人的轨道上。"
最后,他强调了验证的重要性:"最大的障碍是走进某个地方看到它工作。这是整个问题中最难的部分——让它在一段时间内进去自主工作。"
最后我再用三个QA做这个访谈做一个总结:
Q: 四年内10万台机器人的目标现实吗?
A: 从技术角度看是可能的,但挑战主要在制造和成本控制。Figure 3比Figure 2便宜90%,说明他们在成本优化上确实有突破。加上他们的新制造设施"Baku",硬件基础是具备的。关键是能否在保证质量的前提下实现规模化生产,这需要解决供应链、质量控制、维护服务等一系列问题。
Q: 人形机器人真的是AGI的最佳载体吗?
A: 这个判断很有道理。人类社会的基础设施都是为双足直立行走设计的,人形机器人确实是与现有环境兼容性最好的方案。虽然专用机器人在特定场景下效率更高,但通用性是无法比拟的。而且,随着AI能力的提升,通用性的价值会越来越突出。
Q: 如何看待中国机器人公司的竞争?
A: Adcock提到的地缘因素确实存在,但技术竞争才是关键。中国在制造成本和产业链方面有优势,但在AI算法、芯片、操作系统等核心技术上仍有差距。不过,这个差距正在快速缩小。最终的竞争还是看谁能更快地实现技术突破和商业化落地。