媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Waymo联手谷歌Gemini,打造全新端到端自动驾驶模型,未来出行或迎新变革?

2024-10-31来源:ITBEAR编辑:瑞雪

自动驾驶领域的佼佼者Waymo近日透露,其正在研发一种全新的训练模型,该模型基于谷歌的多模态大语言模型Gemini。这一动态标志着Waymo在自动驾驶技术上的又一次重大突破,旨在为其机器人出租车提供更强大的智能决策能力。

Waymo发布的研究论文中详细介绍了这一名为“端到端多模态自动驾驶模型”(EMMA)的新技术。与传统的自动驾驶系统相比,EMMA模型能够更有效地处理传感器数据,并生成车辆未来的行驶轨迹,从而协助无人驾驶车辆做出更为精准的决策。

值得注意的是,这是自动驾驶领域首次尝试将多模态大语言模型应用于实际业务中。此举不仅展示了Waymo在技术创新上的领先地位,也预示着多模态大语言模型在自动驾驶领域的广阔应用前景。

传统的自动驾驶系统往往采用模块化的设计方式,这种方式虽然在过去取得了一定的成效,但在面对复杂多变的环境时,其可扩展性和适应性均显得捉襟见肘。而像Gemini这样的多模态大语言模型则具有更强的通用性和推理能力,能够有效解决这些问题。

据Waymo介绍,EMMA模型在复杂环境下的表现尤为出色。例如,在遇到动物穿越道路或道路施工时,该模型能够帮助无人驾驶汽车迅速找到最佳的行驶路径。

与此同时,特斯拉等其他自动驾驶领域的巨头也在积极探索端到端模型的应用。然而,Waymo凭借其强大的技术实力和丰富的研发经验,在这一领域显然已经走在了前列。

当然,EMMA模型也并非完美无缺。Waymo坦言,在将该模型正式投入应用之前,仍需要进行大量的研究工作。例如,如何降低模型处理3D传感器输入时的计算开销,以及如何提高模型处理图像帧的效率等,都是未来需要重点攻克的难题。

多模态大语言模型在自动驾驶领域的应用还面临着另一大挑战,即如何确保模型的输出结果的准确性。由于无人驾驶汽车的容错率极低,因此任何微小的误差都可能导致严重的后果。这就要求在将这些模型大规模应用于实际场景之前,必须进行更为深入和细致的研究。

《科学》2025十大科学突破揭晓:中国引领可再生能源变革登顶榜首
《科学》认为,2025 年全球可再生能源在多个领域超过传统能源,而这一重大转型正由中国引领。 《科学》认为,中国在太阳能电池、风力涡轮机以及锂电池储能等领域持续扩大布局,巩固了其在全球可再生能源生产和相关技术…

2025-12-19

百度王颖MEET2026演讲:AI赋能打造超级智能体,成就超级个体与组织
以照片直播行业为例,百度网盘通过“存算一体”模式,精准解决了行业长期存在的工作流割裂、存储与修图成本高等核心痛点,依托全链路自动化能力的落地,不但能够实现1110%效率的提升(这是基于我们对完整工作流的测算…

2025-12-19

工程AI“好”的标准之争:算法工程师与总工,谁应掌握定义权?
这个问题,戳中了当前工程AI落地最深的隐痛:技术团队定义的“好”,未必是设计院能用、敢用、愿用的“好”。 结语:好AI,是总工“养”出来的,不是厂商“卖”出来的回到最初的问题:工程AI的“好”,该由谁说了算…

2025-12-19

OpenAI推出GPT-5.2-Codex:软件工程自动化与安全防护再升级
OpenAI表示,GPT-5.2-Codex旨在推进软件工程,软件工程是通过将工程原理与编程知识相结合来设计、开发、测试和维护应用程序的过程。 OpenAI表示,GPT-5.2-Codex引入的改进将对企业…

2025-12-19