在人工智能技术深度渗透各行业的当下,火山引擎于2025冬季Force原动力大会上抛出重磅消息:正式推出豆包大模型1.8与音视频创作模型Seedance 1.5 pro。这一动作不仅标志着大模型技术从单一生成向多模态Agent场景的跨越,更以多项突破性技术指标重新定义了行业标杆。
据火山引擎总裁谭待披露,截至2025年12月,豆包大模型日均token使用量已突破50万亿,较去年同期激增超10倍,更有超百家企业客户累计使用量突破万亿级。这一数据背后,是火山引擎通过技术封装与成本优化持续降低AI应用门槛的战略布局。"我们正推动AI从实验室走向千行百业,让每个企业都能拥有自己的智能体军团。"谭待在接受采访时强调。
作为新一代多模态Agent核心,豆包大模型1.8实现了三大技术跃迁:其视觉理解能力将单次视频处理帧数从640帧提升至1280帧,支持低帧率长视频分析与高帧率关键片段精读,在在线教育领域可自动生成课程知识点图谱,在工业质检场景能实时捕捉0.01毫米级缺陷;工具调用能力方面,模型可自主规划复杂任务流程,像项目经理般协调多步骤操作,支持256K长上下文窗口与API动态清理机制,使长程任务处理效率提升40%;成本优化层面,通过图片压缩比提升与思考长度可调设计,单次推理成本降低35%。
在权威评测中,该模型展现惊人实力:在视觉推理、空间理解等12项任务中登顶榜单,通用智能体测评集BrowseComp得分领先第二名12.7%,数学推理能力逼近GPT-5水平。这些突破使其迅速成为教育、金融、法律等领域的首选方案,某银行客户部署后,智能客服解决率从68%跃升至92%,单次服务成本下降60%。
如果说豆包大模型1.8是智能决策的"大脑",Seedance 1.5 pro则堪称内容创作的"全能艺术家"。该模型首创原生音视频联合生成架构,彻底解决传统方案"音画脱节"的顽疾:通过毫秒级同步技术,使角色口型、语调与表演节奏完美契合,支持四川话、粤语等8种方言及英、法、西等30种语言混合对话;在运动捕捉方面,模型可精准还原发丝飘动、眼神流转等微观细节,其自研的希区柯克变焦算法更让AI视频具备电影级运镜能力。
针对创作痛点,Seedance系列即将上线"Draft样片"功能,创作者可先生成低分辨率预览版,其场景布局、角色动作等核心要素与最终成片保持95%以上一致性。字节跳动内部测试显示,该功能使视频制作周期缩短65%,无效返工率下降60%。目前,个人用户已可通过豆包、即梦AI等平台体验,企业客户自12月23日起可通过火山引擎API接入服务。
技术突破的背后,是火山引擎对AI云原生架构的重构。其全新升级的AgentKit平台覆盖智能体开发全生命周期,通过权限隔离、模型路由等机制解决企业落地难题,帮助小米集团将手机服务资源交付周期从7天压缩至10分钟,汽车业务算法迭代速度提升3倍。而HiAgent智能体工作站则构建起企业级任务调度中心,已服务中国银联、招商银行等数百家头部客户,单企业平均部署智能体数量从2024年的47个激增至2025年的213个。
为进一步降低使用门槛,火山引擎同步推出两项创新计划:豆包助手API将对话、搜索等核心能力标准化封装,企业可像搭积木般快速构建专属智能体;AI节省计划则通过用量承诺折扣机制,最高可为企业节省47%的模型调用成本。这些举措正推动AI应用从单点突破向生态化演进,谭待预测:"2025年将成为Agent技术爆发的元年,每个企业都将拥有自己的AI员工队伍。"

