媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

2025具身智能发展探秘:迈向真正大模型之路还有哪些挑战?

2025-11-28来源:快讯编辑:瑞雪

在人工智能与机器人技术深度融合的当下,具身智能正成为行业关注的焦点。这种让机器通过感知、推理与执行实现物理世界交互的技术,正推动人形机器人从“仿形”向“仿智”跃迁。多模态大模型的快速发展,为机器人赋予了“感知—理解—决策”的底层能力,但距离真正意义上的通用智能仍存在显著差距。

传统人形机器人虽已在运动控制领域取得突破,例如本田ASIMO和波士顿动力Atlas能完成跑跳等复杂动作,但其行为逻辑高度依赖预设程序,缺乏对动态环境的实时理解能力。这种“人形机器”的局限性,在多模态大模型兴起后迎来转机。通过融合大语言模型的语义推理、视觉语言模型的图像解析以及动作模态的执行能力,机器人开始具备初步的自主决策潜力。不过当前技术仍处于初级阶段,距离通用智能所需的跨场景自适应能力尚有距离。

技术架构的迭代呈现出加速趋势。早期SayCan模型通过语言分解任务,但存在模块割裂问题;RT-1采用端到端Transformer架构,实现多模态统一处理;PaLM-E进一步整合传感器数据,支持多步推理;RT-2则构建了“视觉—语言—动作”闭环系统。最新π0系列模型将动作输出频率提升至50Hz,Helix模型通过“快慢脑”架构实现200Hz控制频率,显著提升了机器人的响应速度。这些突破标志着机器人控制从任务规划向高频实时操作的跨越。

数据质量成为制约模型发展的关键因素。训练数据主要分为互联网视频、仿真平台和真实世界三类:互联网数据规模庞大但精度有限,适合预训练;仿真数据成本低廉但存在现实差距;真实数据质量最高但采集成本高昂。行业普遍采用“仿真+真机”混合训练策略,配合光学与惯性动捕技术构建数据采集基础设施。这种模式既解决了真实场景覆盖不足的问题,又通过微调校准提升了模型实用性。

技术演进呈现三大方向:模态扩展方面,触觉、温度等感知通道的融入将构建更完整的环境认知体系;架构创新领域,“世界模型”通过模拟环境动态赋予机器人预测能力,英伟达Cosmos平台已展现这种潜力;数据融合层面,标准化训练场正在成为推动模型迭代的基础设施。这些进展预示着具身智能将突破现有技术框架,向更高级的自主智能迈进。

当前技术仍面临多重挑战。主流机器人智能水平仅达L2级别,在跨平台迁移、多模态融合、实时控制等方面存在瓶颈。数据采集成本高、场景覆盖有限等问题,进一步限制了模型泛化能力。要实现真正的具身智能,需要在模型架构创新、训练数据优化和计算资源协同三个维度取得突破性进展。这场技术革命不仅需要算法层面的持续创新,更依赖工程化能力的系统性提升。

90后“稚晖君”彭志辉履新上纬新材董事长 跨界科技新征程启幕
今年7月,上纬新材宣布智元机器人将通过协议转让和要约收购方式取得公司控制权,并根据协议,转让方向智元承诺2025-2027年度归母净利润和扣非归母净利润分别不低于6000和8000万元。 根据10月29日晚…

2025-11-28

阿里1688“遨虾”AI智能体上线:一键打通跨境供应链,助力商家高效出海
未来,“遨虾”将持续迭代,完善多语言支持、跨平台数据对接和履约协同功能,整合支付、物流、合规等服务体系,提供出口合规建议,帮助商家解决因资质不全引发的退货或下架的问题;并将推出“智能生意经营”功能,辅助商家…

2025-11-28

以算力筑基,凭生态赋能 华为云杭州峰会助力浙企智启新未来
在智能体构建与落地的具体路径上,华为云昇腾云业务解决方案高级总监以《加速跃迁·企业智能体构建与落地》为题,分享了华为云如何通过昇腾云全栈能力助力企业实现智能体规模化部署。语忆科技联合创始人兼CEO吕灜杰以…

2025-11-28

首发骁龙8系新旗舰!一加 Ace 6T携165Hz满帧游戏体验强势登场
从游戏实测的结果来看,一加 Ace 6T「性能狠Pro」的定位绝非噱头,首发第五代骁龙8芯片带来了硬件底气,全新一代「风驰游戏内核」则让硬实力充分发挥,再加上日常游戏的低功耗、重度负载的稳帧率以及165Hz…

2025-11-28

第五代骁龙8移动平台登场:双旗舰布局,性能与智能体验双升级
此前,骁龙7系、6系和4系都为用户提供了多样化的选择,包括代际性能提升和创新技术的标准版、突破性表现的Plus版本,以及专为特定需求设计的S层级。 《IT时报》记者了解到,当前,一加、vivo、iQOO、摩…

2025-11-28