对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

35次阅读
没有评论

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

超算算力自主第一

造车,似乎不再是吉利唯一的重大关切了。

吉利汽车从“轮子上安沙发”的草莽年代起家,完整经历了自主汽车工业从计划到市场、从模仿到创新、从跟随到主导的全过程。刚刚过去的Q2,吉利产销总量和增长率双双告捷。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

逐渐登顶的过程中,吉利还沿途创造了中国汽车工业并购第一案、输出最成功的新能源整车架构SEA浩瀚、孵化巨头车企最成功的新能源品牌极氪……

但2025年的吉利汽车,表现出和其他车企完全不同的关切、进展。

2025年6月,备受关注的机器人明星公司宇树科技完成C轮融资,吉利位列领投方之一。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

一个月后的WAIC 2025,吉利是整个展会上最“秀”车企,旗舰车型、旗舰黑科技、核心高管尽数到场亮相,还公布了全行业首个Agent架构智能座舱。

几乎同时,吉利透露智驾团队在CVPR 2025的自动驾驶场景挖掘挑战赛中击败一众全球顶尘车企及研发团队,斩获世界冠军。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

而翻开吉利Tech官方账号,出人意料地发现知名AI挑战赛冠军、智能化行业“首发”,吉利低调地拿了一个又一个……

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

中国汽车自己的“大众”真的呼之欲出了,但又和普遍认知中的“大众“大相径庭。

智能车参考最近和吉利掌管技术研发的一号位李传海面对面,聊了聊吉利的“反差”。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

他的第一个结论就颠覆印象:

未来,吉利可能成为全球最大的机器人公司

2025年,吉利在做什么

吉利正在做传统车企主观上很难理解,客观上也顾不上的事

2025年,L2+在技术体系、产业链、用户接受程度上迅速成熟,开启全价位全品类普及,不管主机厂是不是真的准备充分,惨烈的淘汰赛已经在进行中了。

年初,吉利联合千里科技,发布了千里浩瀚智能辅助驾驶方案,这一步和主流主机厂步调一致。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

但接下来,吉利的轨迹开始和其他车企分化。

和车展仅相隔几个月的WAIC世界人工智能大会上,只有寥寥3家车企现身:特斯拉、理想、吉利,而吉利又是其中唯一一家带来全面产品展示,落地体验、新技术发布的车企。

旗舰极氪9X,展示了搭载双NVIDIA DRIVE Thor芯片,总算力超过1400 TOPS,还有行业唯一的5激光雷达的智能辅助驾驶方案:

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

这样的架构体系,其实早已超越“辅助驾驶”功能,核心是系统对道路场景、自车状态和用户意图都有准确的理解认知。

比如面对低速车辆场景,你只需对车机说:给我超过前面那个车。

系统通过座舱语音大模型理解用户的语义后,再通过VLA大模型自动识别周边情况,并在合适的时机自动作出符合预期的超车行为。

用户直接交互的座舱层面,吉利和千里科技一同发布了Agent OS

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

举个例子,你刚刚下班回家想点一份外卖吃,你直接告诉车载AI:

帮我点一份上周吃过的那个湖南菜,辣少一点,大概四五十块钱,我差不多到家的时候送到。

一句话,Agent自动调用一连串能力,包括车载VLA理解意图、回溯以前的交互历史、生成任务决策链条、找到对应APP点单、调用支付软件,然后再根据导航信息计算送达时间……用户全程不用动手,也不需要亲自拆解复杂任务,一一给车载助手解释。

吉利官方很低调,但按照按OpenAI提出大模型五级发展框架定义,以智能体为核心的Agent OS,实际上已经率先实现了智能座舱的“L3”:

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

辅助驾驶,吉利追求的和主流车企不同:不满足只交付一个端到端模型,达成一个名义上的“第一梯队”,而是在车端云端超大算力配合下,用一个多模态大脑拉通舱驾。

智能座舱,吉利现在也跳出车圈传统的“8XXX芯片、XXms对话延迟”这样的话语体系,体验上彻底抛弃“车载平板”模式,用AI Agent 重新塑造交互。

你会发现吉利给出的智能化答案,完全超脱了2025年行业公认的车企“及格线”:实现“车位到车位”。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

按judge车企的标准,很难给吉利打分。

主机厂对于智能化追赶,大部分都在技术方案层面——端到端、VLA、激光雷达……或自研或在供应商配合下应上尽上,但吉利在更深的一层做规划和考虑——汽车智能化背后的基础、本质:AI

背后的认知,李传海这样解释:

辅助驾驶技术,是一种“AI根技术”

吉利到底有什么样的智能化技术?

从最近的一次“冠军”看起——CVPR 2025的Ar-goverse2 2025场景挖掘挑战赛。

VLA(认知能力和轨迹输出)+世界模型(仿真测试数据生成)+强化学习(安全可靠性边界)技术范式开始广泛应用,基本解决了端到端的黑盒、数据来源不稳定(路测收集的人驾数据)问题。

但又带来新挑战:如何保证持续输入同类型高价值数据让系统训练?

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

这个挑战赛的核心任务,是如何从海量仿真数据里精准挖掘出那些最关键的corner case场景,定位相关物体,预测其轨迹。

吉利的解题思路是这样:

全局情景洞察,以及全局自反思(In-context Learning, reflective capabilities):将成千上万个不同的场景描述,打包成一个巨大的“信息包”,一次性展示给大语言模型。大语言模型在庞大的信息上下文中,能自主发现规律、建立联系,从而实现“举一反三”。遇到新问题时,能立刻从“记忆”中调取相似的案例进行类比,大大提升了理解的深度和准确性。

多智能体协作与自校正:一个“生成器”Agent体负责快速将场景提炼的语义信息转换成代码,而另一个“精炼器”Agent则扮演着严苛的“代码评审专家”,负责检查和优化。

双大模型代理+源代码生成框架,成功解决了”复杂时空事件精准定位”这一端到端的核心难点,为L3级的场景理解能力提供了可复用的技术范式。

而且这个技术不是仅仅发个paper刷个榜单,吉利已经计划部署在即将上市的极氪9X车型上。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

从辅助驾驶技术的全景来看,吉利最近拿的这个冠军,属于“算法、算力、数据”三要素的“数据”层面。

对于大部分车企来说,算法可以采购,但掌握这样的数据能力,就相当于掌握核心智能化技术,甚至可以说是“拿到了下半场入场券”。

但李传海认为,“智能化核心技术”对吉利来说,不只局限在单一要素,甚至也不只局限在“辅助驾驶”这个产品。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

2017年,李传海领导吉利汽车研究院团队推进面向车端、B端大数据体系项目,当时团队就意识到了如此巨量的数据,蕴含的价值绝不仅仅满足传统底盘、车身功能开发,或者是内部的供应链管理等等。

管理、利用这些海量数据,也不可能再靠人工数据看板的老办法。

自然而然——数据用来训AI,AI用来管数据,这样的认知驱动下,吉利研究院开始组建自己的大模型团队,以及开始了自己的算力基础设施建设。

之前多次在各大数据集上刷榜拿冠军的吉利AI Drive模型,就是这种认知驱动的成果之一,属于吉利自研星睿大模型体系中的一员:

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

3大基础模型对应的,其实就是VLA、VLM、世界模型,只不过2021年吉利启动研发时,行业还没有这些“时髦”的名词。

吉利自建的大模型体系,涵盖辅助驾驶、智能座舱、智能AI底盘,除了量产上车的功能体验之外,同时也深入到研发流程方方面面。

与大模型能力一同开始构建的,还有算力:

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

吉利联合生态科技伙伴,成立的全球唯一“智能汽车算力联盟”——星睿智算中心2.0,算力规模约23.5 EFLOPS,国内车企No.1(特斯拉建成算力约30 EFLOPS)

支持了吉利从基础大模型训练、电池云端管理、智能网联、整车安全等等业务…..

吉利到底掌握了怎样的智能化核心技术?

从算法来看,是“代码”级的VLA多模态大模型。

从算力来看,是自主No.1、全球领先的超算基础设施。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

而从数据来看,吉利300万年销量规模还在其次,重要的是数据利用处理能力,外界刚刚从CVPR 2025的挑战赛上窥得“一角”。

李传海认为,这样的能力构建其实对于目标锚定在“智能汽车”的玩家来说并不是必须的。

因为2025年已经有太多优秀的智能车技术供应商,能满足车企转型“造一辆智能汽车”的需求。

但全面拥抱供应商,核心竞争力同质化是一方面,另一方面代表着更容易被“锁死”在单一的“汽车智能化”阶段。

构建“智能化核心技术”的过程,吉利看到了一条超越“汽车”的更广阔赛道和机会。

“全球最大机器人公司,可能是吉利”

吉利造车分成4个阶段,李传海一一亲历,从基层技术干到集团技术研发一号位。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

“四个轮子上安沙发”,对应的正是1.0阶段。

2004年李传海进入吉利,刚好是吉利从1.0转向2.0的阶段,核心是制造水平,包括动态性能、静态质感、安全性能、用户体验的全面提升

作为项目经理,李传海参与了帝豪EC7/RV的整车研发。三年之后,帝豪走向市场,一炮而红,时至今日累计销量400万。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

2.0阶段的吉利,从技术研发体系、生产供应体系、产品营销体系均发生了重大转变,体系化造车思维开始扎根,催生了3.0阶段的变革——

2010年瑞典哥德堡,李书福18亿美金将沃尔沃收入囊中,挖到了全球汽车工业的宝藏:2013年2月,吉利与沃尔沃在瑞典哥德堡联合成立中欧汽车技术中心(CEVT),并开始构建CMA模块化架构。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

这一阶段基于CMA架构,李传海主导了神车博瑞的开发,成为吉利年销破百万的主力车型之一。

后来吉利打造出爆款极氪、对外输出最成功的新能源架构SEA浩瀚,其实也是对3.0阶段“体系化造车”的继承。

当然也有发展——SEA浩瀚架构之后的4.0阶段,吉利开始进入“智能新能源造车”,李传海带队的吉利汽车研究院,拿出了一系列雷神超级电混、神盾电池、星睿大模型等等。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

李传海说,从2024年下半年开始,团队敏锐感觉到了新的变化。

这个趋势,是具身智能开始进入前所未有的爆发期,机器人的交互、运动能力呈现出突破性进展,进而发掘出无数新的应用场景,自然而然带动新的一波投资浪潮……

吉利看到的是背后技术趋势。

其实,具身智能和自动驾驶一样,前端都需要感知环境,后端都需要能理解认知场景,并且能自主规划控制运动机构的大脑

而在VLA之前,这样的的大脑只存在于构想中。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

VLA分三个部分,输入是V——广义的视觉,可以是图像、点云图、红外感应图;基础是L——语言,从输入中提取对环场景、目标、事物因果关系的理解;输出是A——动作,可以是汽车、机器人的规划动作、轨迹,也可以是系统内部的应用、接口调用。

VLA基座模型之上,可以在针对不同特定任务训练不同的模型,比如专门发明新蛋白质结构的、钻研物理公式的、情感陪伴的…

当然,更可以是执行“go anywhere”任务的AI司机、可以是在家庭、在工厂“do everything”的机器人。

所以从底层计算芯片,到基础模型架构,再到前端感知设备,自动驾驶和具身智能高度复用,这也是为何现在大部分机器人创业团队都是资深自动驾驶团队班底。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

更直白说,智能汽车就是一种四轮机器人,也是“第一性原理”的终极实践:

车载(或是其他终端)AI具备和人类一样的能力、潜力,然后用它本身的理解认知能力去学习处理各种复杂任务

现阶段,吉利在智能汽车上实践的,是从单域垂直纵深发展到横向跨域融合,逐渐同一个计算平台、同一个模型执行所有智能汽车任务:既是与用户交互的入口,也是车载AI理解整个场景环境,指导自动驾驶轨迹选择的大脑中枢。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

下一个阶段,用超大模型、超大算力拉通各个AI终端,让汽车往AI智慧生命体方向的蜕变

千里科技,前不久刚刚在机器人学习的基准测试平台RLBench的跨任务测试中,平均成功率率先达到90%。

用的机器人模型,与吉利即量产交付车端模型同源同架构,都是VLA

今年是李传海在吉利工作的第21个年头,职位是吉利汽车副总裁、吉利汽车研究院院长。

与2004年刚加入时相比,吉利现在拥有的是:

年产销规模超过300万辆、利润超200亿、自主车企最大算力设施,以及自研的大模型体系。

还有具身智能浪潮。

对话吉利技术一号位:VLA大模型打底,冲刺全球最大机器人公司

2025年,吉利造车和4.0阶段相比,又有了新的变化,底层驱动因素,是多模态大模型的快速成熟。

而这个阶段的主要任务,李传海这么描述:

未来全球最大机器人公司,可能是吉利,而“机器人”这个词,背后代表了很多东西。

说得直接点,吉利在这方面有很大的野心。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy