当自动驾驶遇上大模型(当自动驾驶遇上大模型怎么办)
说起AI技术,自动驾驶与大模型是两大重要议题。而在“AI热潮”催化之下,作为AI关键载体之一的机器人将这两条主线汇聚至一处,指向了AI下一个浪潮“具身智能”,即能理解、推理、并与物理世界互动的智能系统。
特斯拉不久前披露Optimus人形机器人最新进展,机器人展现出不带辅助的行走能力,且能精准做到电机转矩控制,产品力的进步也被看作产业化渐近的信号。值得注意的是,Optimus内置FSD芯片、与汽车共用AI系统,毕竟正如马斯克所说,“我们的汽车差不多算是有轮子的半感知机器人。”
与此同时,相继面世的大模型则进一步赋予了机器人更智慧的“大脑”与“感官”。
例如Meta的SAM(Segment Anything Model)模型可分割图像中的一切对象,向多模态更进一步的同时,一举突破了机器视觉底层技术;还有谷歌联合柏林工业大学团队发布的“史上最大‘通才’AI模型”PaLM-E,只需要一句简单指令,便可实现更为自主的机器人控制,使得机器人的行动不再需要仰赖人类的手写指令与代码。
可以看到,这场由ChatGPT引起的“AI狂欢”中,技术大跨步迈进的,并不只有能在线上与用户自由交流的聊天机器人,更有线下能与现实世界切实交互的实体机器人们——此番热潮赋予了后者更聪明的大脑、更敏锐的眼睛以及更具行动能力的躯体。
特斯拉“擎天柱”:站在机器人、AI、自动驾驶的交汇点
在人形机器人行业中,特斯拉的Optimus(擎天柱)可以说得上是行业“领头羊”。
特斯拉研发人形机器人的初衷,便是最大程度上利用特斯拉在造车和自动驾驶方面的优势,特别是自动驾驶研发过程中积累的算法经验、数据驱动能力、AI芯片能力、模型训练能力等。开源证券指出,智能是特斯拉投入机器人领域最核心的竞争力。
人形机器人与特斯拉自动驾驶汽车都遵循“感知-认知-决策-执行”运行逻辑。而正如上文提到的,特斯拉机器人与汽车共用FSD系统。该系统由数据、算法、硬件构成整体架构,其迭代路径则是通过不断升级算力的硬件来支撑不断升级的算法,从而处理不断增加的海量数据。
其中,分析师指出,数据方面,特斯拉FSD系统已有海量数据储备,开发人形机器人可节省大量前期费用。
感知方面,特斯拉FSD系统拥有非常强大的纯视觉感知方案,特斯拉已引入Occupancy Network,与激光雷达相比,其视觉的语义感知能力更强。对于成本控制更加严格的人形机器人而言,类似Occupancy Network的方式优于激光雷达解决方案。
规划和控制方面,特斯拉“交互搜索”规划模型进一步增强了FSD系统的规控能力,且FSD系统还能通过Occupancy Network对可视区域进行建模,以处理未知不可见场景。
人工智能与机器人相辅相成
大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,推动机器人向更智能、灵活和自主的方向发展。
人工智能是机器人实现智能化的关键,而与此同时,对于人工智能技术而言,机器人则是重要落地场景。如广发证券指出的,人形机器人作为具象的实体,是AI绝佳载体。
一方面,机器人、特别是人形机器人能丰富AI的表现方式。除了传统的语音交互、图片交互,人形机器人也为AI带来了更多的交互方式,包括表情、手势等,极大延展了AI的表达领域。
另一方面,机器人也承担起了AI输出窗口的作用。
以英国机器人公司Engineered Arts研发的一款类人型机器人Ameca为例,除了与人类相像的外表,其最重要的功能便是为各种AI技术提供了一个真实的平台。用户可以根据需要,从库中快速加载预先保存的姿势、声音、动画和子序列,只需使用、宁江机床、北平机床已具备批量生产高精度齿轮加工设备的能力。
(5)其他零部件:特斯拉人形机器人电池实现小体积大容量,推测复用汽车动力电池技术。视觉传感器硬件为左右单目相机+鱼眼相机,硬件成本较低,依赖算法。集成汽车视觉传感技术,工厂等部分场景有应用GPS传感器。
数据显示,目前Optimus硬件成本占BOM表比例超过50%,要达到2万美元售价还有84%的降价空间。对比当前时点和终局状态下BOM表拆解,开源证券指出,线性关节和灵巧手的降本空间最大。
总体而言,目前人形机器人成本约为 10-15 万美元左右。优必选预测,根据量产规模不同,人形机器人降本进程大致分为3个阶段:
几千台小批量生产,降本20%-30%至约10万美元;
1万-几万台量产,降本50%至5万美元;
几十万至上百万台大规模量产,降本70%-80%至2-3万美元。
结语
总体而言,AI大模型与人形机器人的相辅相成,迈出了通向通用人工智能的一大步。
国泰君安指出,服务机器人商业化落地的前提是产品能提供真实价值,而真实价值的判断在于机器人能否通用。将机器人做成人形,便是为了使机器人的执行能力更加通用。
伴随着自动驾驶技术的高速发展,人形机器人在视觉、SLAM与基础AI上有了更多方案选择。分析师预计,大模型的出现,会从语音、视觉、决策、控制等多方面实现同人形机器人的结合,形成感知、决策、控制闭环,机器人产业有望进入渗透率快速提升的新阶段。
-
沪指高开0.14% 食品饮料板块领涨
6月14日,A股三大指数集体高开。据Wind数据,上证指数高开0.14%,报3238.12点;深证成指高开0.2023-12-09 21:00 -
三大指数全线上涨 美容护理板块领涨
6月14日,A股市场震荡反弹。截至午间收盘,上证指数上涨0.24%,报3241.58点;深证成指上涨0.602023-12-09 21:00 -
创业板指高开0.07% 通信板块领涨
6月19日,A股三大指数开盘涨跌不一。据Wind数据,上证指数低开0.07%,报3271.16点;深证成指低2023-12-09 21:00 -
创业板指半日跌0.33% 计算机板块逆市领涨
6月19日早盘,A股三大指数震荡走低。据Wind数据,截至午间收盘,上证指数跌0.54%,报3255.69点2023-12-09 21:00 -
创业板指收跌0.21% 光模块等板块逆势上涨
6月19日,A股三大指数集体收跌。据Wind数据,截至收盘,上证指数跌0.54%,报3255.81点;深证成指2023-12-09 21:00 -
A股三大指数涨跌不一 酿酒行业、汽车服务、通信设备板块领涨
6月14日,A股盘面上看,三大指数涨跌不一。据数据显示:截至收盘,上证指数收跌0.14%,报3228.992023-12-09 18:00 -
“风电紧固件第一股”飞沃科技登陆创业板
6月15日,风电紧固件龙头企业飞沃科技敲响深交所上市钟声,正式登陆创业板。创业板迎来“2023-12-09 18:00 -
A股市场震荡调整 成交额突破1万亿元
6月14日,A股市场震荡。截至收盘,上证指数下跌0.14%,报3228.99点;深证成指上涨0.26%,报109842023-12-09 18:00 -
创业板指半日涨逾1% AI机器人概念板块领涨
6月15日早盘,A股三大股指高开后,沪指涨幅回落,创业板指半日反弹逾1%。Wind数据显示,截至午2023-12-09 18:00 -
创业板指涨逾2% 宁德时代涨近6%
6月15日,A股市场高开高走。Wind数据显示,截至13:32,上证指数上涨0.47%,深证成指上涨1.41%,创2023-12-09 18:00
TOPS
- 一周排行榜
- 一周排行榜