媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

DeepSeek-V4预览版上线开源:百万字上下文,Pro与Flash双版本齐发

2026-04-24来源:互联网编辑:瑞雪

DeepSeek 正式发布全新系列模型 DeepSeek-V4 的预览版本,并同步开源,为人工智能领域带来新的突破。该模型具备百万字超长上下文处理能力,在 Agent 能力、世界知识储备以及推理性能方面均达到国内开源领域的领先水平。

DeepSeek-V4 系列模型分为两个版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。官方介绍,DeepSeek-V4 开创了一种全新的注意力机制,通过在 token 维度进行压缩,并结合 DSA 稀疏注意力技术,实现了全球领先的长上下文处理能力,同时大幅降低了对计算资源和显存的需求。从即日起,100 万上下文将成为 DeepSeek 所有官方服务的标准配置。

在 API 服务方面,DeepSeek 已同步完成更新。用户只需将 model_name 修改为 deepseek-v4-pro 或 deepseek-v4-flash,即可调用相应版本的模型服务。

DeepSeek-V4-Pro 在 Agent 能力上表现尤为突出。在 Agentic Coding 评测中,该模型已达到当前开源模型的最佳水平,并在其他 Agent 相关评测中同样取得优异成绩。目前,DeepSeek-V4-Pro 已成为公司内部员工使用的 Agentic Coding 模型。据评测反馈,其使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍存在一定差距。

在世界知识测评中,DeepSeek-V4-Pro 的表现同样亮眼,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。而在数学、STEM 以及竞赛型代码的测评中,该模型更是超越了所有已公开评测的开源模型,成绩可与世界顶级闭源模型媲美。

相比之下,DeepSeek-V4-Flash 在世界知识储备方面略逊于 Pro 版本,但其推理能力与之接近。由于模型参数和激活量较小,V4-Flash 能够提供更快捷、经济的 API 服务,满足对成本和效率有较高要求的用户需求。

在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上的表现与 Pro 版本不相上下,但在处理高难度任务时仍存在一定差距。这一特点使得 V4-Flash 更适合对计算资源有限制或对任务复杂度要求不高的场景。