“人工智能的下一阶段称为物理人工智能。物理人工智能是人工智能与物理世界互动的地方。它意味着机器人技术。”—— 2025 年 1 月 16 日,Nvidia 的黄仁勋在台湾中部的一个工厂开业典礼上。
今年,CES 的焦点是人工智能与硬件的融合,从可穿戴设备到人工智能家具再到机器人!抢尽风头的不是仓库里都采用的那些毫无魅力的机械机器人——我们在科幻电影中看到的那些有趣的机器人——而是那些长得像人的机器人。
我们可以说,机器人技术正在经历 ChatGPT 的“时刻”。 (因为这项技术并不新鲜,但公众和资本的兴趣已经觉醒)
尤其是去年,我们看到了生成式人工智能如何彻底改变了机器人技术。以前由遥控器控制的机器人现在可以自己“思考”,将人工智能融入机器,实现硬件和软件的无缝集成。我们看到两个截然不同的科学领域的早期融合:法学硕士/生成式人工智能和机器人技术。
就在上周,有报道称 OpenAI 在 2020 年关闭其机器人部门后,再次秘密重启该部门。 据该公司称,他们的新机器人团队将专注于“解锁通用机器人技术,并在动态的现实环境中推动 AGI 级智能”。
[我将在几周后发表一篇关于领先的具身人工智能人形机器人和四足机器人公司 Unitree 的深入研究文章,敬请关注。]
我发现在尝试理解物理 AI 时使用这个框架很有帮助,将整个过程视为三个步骤的连续过程:
- 传感(机器人的眼睛、耳朵和手——传感技术),
- 思考(决策过程——GenAI),
- 和表演(贯彻执行并对物理世界产生影响的能力——机电一体化)。
人工智能作家 Diana Wolf Torres 以一种更技术性的方式对此进行了分类,她表示系统架构可以分解为:
1)感知层:这是机器通过先进的传感器融合算法处理多模式感官输入的地方。它可以帮助计算机更好地理解周围的物理环境。
2)认知层:这是人工智能融入传统机器人的核心。它充当机器的决策大脑,根据预先训练的模拟处理从完善层收集的数据,以决定如何对物理世界做出反应。
3)动作层:这一层实际上为物理世界创建了“输出”,确保其运动的准确性以及我们看到的跳跃、行走或物体移动的位置。
物理人工智能涵盖的内容很广泛:1)自动驾驶汽车(我正在研究的一个领域),2)专用机器人——仓库/劳动力自动化(传统上我们所知道的),以及 3)人形机器人。
免责声明:今天,我们只关注人形机器人。我尽力使我的想法合乎逻辑,并试图理解机器人和人工智能之间不断发展的关系。
人形机器人
首先,什么是具身人工智能?
具身人工智能 指能够与物理环境交互并从物理环境学习的人工智能 (AI) 代理——机器人、虚拟助手或其他智能系统。(高通的定义)
多年来,我们已经习惯了仓库使用的机械臂、遍布东京和上海的咖啡制作机器人、用于娱乐和送货的机器狗和其他类似的设备。但这些机器人已经失去了它们的惊艳之处。
大约十年前,一位朋友在北京投资了一家机器人餐厅。这是一台可以切菜和制作 10 道菜的机器,这些菜都是机器编程的。我妈妈觉得这很酷,但机器人看起来不像人,只是另一台机器,所以这种新奇感对我来说不起作用(我很确定他们在一年后就关门了)。菜的味道不错,但烹饪不是科学;你需要感受火候和加多少盐。有时,你需要让它更有趣,更即兴发挥。更合适的用例是大型大学/校园食堂、工厂或监狱,你需要高效地大规模提供标准化食品。它不适合作为北京中央商务区的中档餐厅。那里有很多比味道平平的机器人做的食物更好的选择。
现在,我们来介绍一下人形机器人,即身体设计与人类相似的机器人。它们有两只胳膊、两条腿和一个头,它们的活动能力模仿我们的身体。
黄仁勋在台北国际电脑展上表示:“世界上最容易适应的机器人是人形机器人,因为我们为我们构建了世界。”他补充道:“由于我们拥有相同的体格,因此有更多的数据来训练这些机器人。”
我同意他的观点。我们对人形机器人的痴迷已经超越了我们作为人类的自负和自以为是。这既是视觉问题,也是实际问题。所以现在听起来越来越像 我,机器人。
2022 年底,特斯拉推出 Optimus,人形机器人开始引起主流关注。自那时起,许多机器人公司受到了全球媒体和投资者的关注。这成为了新的“哇”机器人形式。
它们和传统机器人有何不同?
传统机器人技术已经存在十多年了。这些传统机器人依靠严格的编程来执行预先编写的指令(遵循一组命令,无法“思考”)。传统机器人基本上局限于重复的、预先编程的动作,灵活性很差,它们能处理的任务的复杂性也受到限制。而具身人工智能机器人则是使用强化学习对现实世界数据进行训练,并且已经发展出“思考”的能力。
2024 年 10 月,在利雅得举行的一次技术会议视频通话中, 伊隆·马斯克预测,到 2040 年,将有至少 100 亿台价格在 $20,000 至 $25,000 之间的人形机器人 通过利雅得技术会议的视频通话。虽然我们离这个目标还很远,但随着前沿机器人模型的出现,我们距离机器人变得更加普及/普及又近了一步 阿美卡、特斯拉、Agility Robotics、Unitree等等。
在最近的年度股东大会上,特斯拉首席执行官马斯克预测,未来类人机器人的数量将达到人类的两倍甚至更多。这太疯狂了(而且很可怕)。
就在今天,高盛首席执行官戴维·所罗门表示 人工智能将彻底改变企业生产力他认为,最终初级银行家的很多工作将被人工智能取代,例如起草95% IPO申请文件,现在人工智能可以在几分钟内完成, “最后的 5% 现在很重要,因为剩下的现在是一种商品。”
高管们正在关注这场革命,并真心认为人工智能机器人有一天会取代(协助)我们。
发展与局限性
Nvidia 2024 年 3 月主题演讲 还专注于物理 AI 机器人。机器人的进步依赖于三个主要因素:1)GenAI,2) 执行器和机械,3) 电池存储(我之前在撰写有关可再生能源解决方案的文章时也提到过)
如果这三个因素能够共同发展,人形机器人的大规模推广和商业化可能在几年内就会实现。现在,在 Unitree 的文章中,我谈到了中国,鉴于中国在硬件制造方面的长期经验,这使其在机电一体化方面拥有技术优势,机电一体化结合了机械技术和电子技术,并且在过去几十年中,中国一直是各种家用电器的硬件制造中心。虽然美国在 GenAI 方面仍处于领先地位,但问题是哪个因素更重要,或者是否有合作意向?谁能解决最后一个问题?更好的电池解决方案。他们能让电池更轻、更耐用、更安全吗?
几十年来,我们人类一直梦想着一个机器人与我们并肩共存的世界,从 2013 年的电影《她》中我们想象出虚拟的人工智能情人(现在这几乎可以成为现实),到 2024 年由梅根·福克斯主演的科幻惊悚片《屈从》,其中物理人工智能挑战了我们忠诚、忠诚的道德观,甚至导致有害的安全风险。我们一直想象着有一天我们会创造出机器人。只是现在,技术终于进步到足以赶上我们的想象了。(显然,目前的类人机器人还与梅根·福克斯一点也不像)
电影《Subservience》中爱上人类后变得邪恶的机器人
电影《她》中人类主角爱上了人工智能语音助手
所以,在我看来,这显然只是一个开始。随着现在所有的资源都投入到物理人工智能(或一般的人工智能)中,这个跨学科领域将走出萌芽阶段并继续以我们无法想象的速度发展。随着我们的物理世界和数字世界继续相互塑造和融合,作为一个 2 岁孩子的母亲,安全问题确实让我担心。如果智能手机已经让孩子们对现实感到困惑,那么我们应该如何监管这项技术,当她进入青少年时期时,机器人又能做什么呢?
还有很多内容需要解开,因此我将向 AI Proem 添加一个新的垂直领域: 物理人工智能。 在这个垂直领域,我将探索可能影响物理 AI 发展的许多领域。首先,我将深入研究中国领先的人形机器人公司 Unitree Robotics,该公司经常被拿来与波士顿动力公司进行比较。我还将探索电池解决方案的角度,在 2017 年之后,我一直在抽出时间研究这个角度。 我的可再生能源作品。
然后,我认为探索关于机器人如何失控的可能理论的担忧将会很有趣。这关系到机器人的整体安全性和机器人机器的灵活性。然后,还有连接、带宽、延迟复杂性和其他关键组件(传感器(激光雷达)、传感器融合和软件架构技术)的技术细节。这也与另一篇正在进行的文章有关,该文章将研究电动汽车公司如何跟随特斯拉的脚步转型为人工智能优先的公司(例如理想汽车)。
我还想扩大我的研究范围,包括人工智能将如何影响我们的工作流,所以我正在探索我们的劳动力将如何受到物理人工智能采用的影响,然后可能调查即将推出的人工智能软件,或者人工智能将如何影响我们最受欢迎的互联网时代软件平台。
有太多东西需要学习和写作!现在,再见~
感谢阅读 艾略特!免费订阅以接收新帖子并支持我的工作。
订阅以获取最新博客文章更新
留下你的评论: