媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

百度文心Moment大会启幕 文心5.0正式发布 引领AI应用新变革

2026-01-23来源:快讯编辑:瑞雪

百度近日正式推出原生全模态大模型文心5.0,标志着其在人工智能领域的技术突破迈入新阶段。该模型采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一框架下联合训练,实现了真正的多模态统一理解与生成。与传统的“后期融合”方案不同,这一技术路线使多模态特征在统一架构下充分融合,避免了拼接式处理的局限性。

文心5.0的参数规模达2.4万亿,通过超大规模混合专家结构实现超稀疏激活,激活参数比低于3%,在保持强大能力的同时显著提升了推理效率。模型还引入了基于思维链和行动链的端到端多轮强化学习训练方法,结合大规模工具环境合成的长程任务轨迹数据,大幅增强了智能体和工具调用能力。在40余项权威基准测试中,其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等国际主流模型,图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。

应用层面,文心5.0已构建起覆盖通用场景与行业需求的模型矩阵。矩阵模型包括文心Lite、视频大模型和语音大模型,面向产品级应用快速落地;专精模型则针对搜索、电商、数字人等垂直领域开发,如搜索闪电专精模型、电商蒸汽机模型等。百度应用模型研发部负责人透露,基于声音Token的端到端合成大模型通过离散语音表示、MoE韵律建模和Unet自重构特征等技术,实现了高质量语音合成;5分钟直播技术通过少量音色采样和韵律模式匹配,使合成语音具备直播带货所需的情绪感染力;实时交互数字人技术采用三态Token联动架构,突破传统模态串联模式,实现文本、语音、视频的流式控制,百度罗永浩数字人即基于此技术开发。

为推动大模型在产业中的落地,百度千帆平台推出Agent Infra解决方案,提供包括文心5.0在内的150余个全场景模型服务,集成百度AI搜索等工具及MCP和Agent工具链,结合数据管理和企业级服务,为企业提供全周期、多场景的业务运行环境。目前,千帆平台已累计开发超130万个Agents,以百度AI搜索为代表的工具日均调用量突破千万次。此前,百度数字人技术已在直播带货等领域广泛应用,2025年罗永浩数字人直播曾创下行业纪录。

作为国内大模型领域的先行者,百度正通过“芯云模体”全栈自研生态闭环持续探索AI赋能行业的路径。该生态以芯片为底座、智能云为平台框架、模型为支撑,形成覆盖硬件、算法、应用的完整链条,为AI技术从实验室走向真实场景提供了可复制的解决方案。当前,全球AI行业正加速向应用层拓展,如何让技术真正服务于产业需求成为关键课题,百度的实践为这一方向提供了重要参考。

苹果携手谷歌Gemini!iPhone用户即将解锁超十项AI智能新体验
虽然苹果尚未确认具体哪些“AppleIntelligence”和Siri功能将集成Gemini模型,但根据行业传闻,由Gemini驱动的Siri将获得全面升级,能力大幅拓展。 个人上下文理解:Siri能利…

2026-01-23

农业AI大模型“深耕细作”:垂直领域技术融合与创新实践之路
其大模型系统在国家级园区与大型农场的应用表明,当AI能够综合历史数据、实时感知与领域知识,对作物生长状态做出诊断性认知,并进一步生成可执行的农艺处方(如变量施肥网格图、精准灌溉时间表)时,才能真正实现从“辅…

2026-01-23

亚马逊2026 Nova AI挑战赛启幕:聚焦可信软件智能体应用开发新赛道
将从2026年Amazon NovaAI挑战赛申请池中选出十支大学团队,作为开发团队(在智能体编码系统中构建防御和可靠性)或红队(探测系统以揭示故障和安全弱点)参与竞赛。A:2026年Amazon No…

2026-01-23

守护清朗网络空间:多方共治让互联网成为营商环境“助推器”
牢记“质疑不等于审判,监督不等于抹黑”,以理性发言守护公平竞争的市场环境,让网络空间成为推动企业进步、行业发展的正向场域。当平台守土有责、大V守规自律、企业善用网络、监管精准发力、网民理性参与,就能构建起“流…

2026-01-23

字节跳动DiscoX出炉:专业长文档翻译评测基准下的AI能力新洞察
这也为未来的技术发展指明了方向:真正的突破不在于进一步提升单句翻译的准确率,而在于增强AI系统在语篇层面的理解和协调能力。DiscoX的测试结果显示,即使是最先进的AI系统,在专业长文档翻译方面仍有明显不足,…

2026-01-23