Waymo联手谷歌Gemini，打造全新端到端自动驾驶模型，未来出行或迎新变革？-峰会论坛-媒体界

自动驾驶领域的佼佼者Waymo近日透露，其正在研发一种全新的训练模型，该模型基于谷歌的多模态大语言模型Gemini。这一动态标志着Waymo在自动驾驶技术上的又一次重大突破，旨在为其机器人出租车提供更强大的智能决策能力。

Waymo发布的研究论文中详细介绍了这一名为“端到端多模态自动驾驶模型”（EMMA）的新技术。与传统的自动驾驶系统相比，EMMA模型能够更有效地处理传感器数据，并生成车辆未来的行驶轨迹，从而协助无人驾驶车辆做出更为精准的决策。

值得注意的是，这是自动驾驶领域首次尝试将多模态大语言模型应用于实际业务中。此举不仅展示了Waymo在技术创新上的领先地位，也预示着多模态大语言模型在自动驾驶领域的广阔应用前景。

传统的自动驾驶系统往往采用模块化的设计方式，这种方式虽然在过去取得了一定的成效，但在面对复杂多变的环境时，其可扩展性和适应性均显得捉襟见肘。而像Gemini这样的多模态大语言模型则具有更强的通用性和推理能力，能够有效解决这些问题。

据Waymo介绍，EMMA模型在复杂环境下的表现尤为出色。例如，在遇到动物穿越道路或道路施工时，该模型能够帮助无人驾驶汽车迅速找到最佳的行驶路径。

与此同时，特斯拉等其他自动驾驶领域的巨头也在积极探索端到端模型的应用。然而，Waymo凭借其强大的技术实力和丰富的研发经验，在这一领域显然已经走在了前列。

当然，EMMA模型也并非完美无缺。Waymo坦言，在将该模型正式投入应用之前，仍需要进行大量的研究工作。例如，如何降低模型处理3D传感器输入时的计算开销，以及如何提高模型处理图像帧的效率等，都是未来需要重点攻克的难题。

多模态大语言模型在自动驾驶领域的应用还面临着另一大挑战，即如何确保模型的输出结果的准确性。由于无人驾驶汽车的容错率极低，因此任何微小的误差都可能导致严重的后果。这就要求在将这些模型大规模应用于实际场景之前，必须进行更为深入和细致的研究。

可以说，此项合作对于双方来说可谓是重大利好，苹果Siri终于迎来基于AI的突破式变革，而谷歌母公司Alphabet市值也在苹果带来的多年协议推动下，首次站上4万亿美元市值超级关口，成为市值仅次于英伟达的公司…

2026-01-21

家庭与教育领域成为热门赛道，“新世代家庭的养育声场”相关播客内容激增，涵盖儿童保健、科学养育、代际沟通等多元话题，“教育”类播客关键词搜索量同比增长99.57%，单集数量与播放量也大幅提升，为父母提供了平等…

2026-01-21

抖音生活服务生态在2025年持续壮大，平台全年总交易额同比增长超59%，实现经营收益的门店数突破1500万家。抖音生活服务上海大区负责人陈鸣介绍，生意的增长离不开商家、服务商、达人等生态伙伴的共同推动。2…

2026-01-21

月 21 日消息，OpenAI 为实现通用人工智能（AGI）的愿景筹集资金，确认未来几周在 ChatGPT 免费版、ChatGPT Go版本中开始投放广告。 OpenAI 官方今日发布了一段播客视频，Ope…

2026-01-21

2026-01-21

2026-01-21

2026-01-21

2026-01-21

2026-01-21

2026-01-21