媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

阿里千问Qwen3-Coder-Next发布:低推理成本赋能高效编程智能体新突破

2026-02-04来源:快讯编辑:瑞雪

阿里巴巴千问团队近日正式发布了一款面向编码代理与本地开发场景的开放权重语言模型——Qwen3-Coder-Next。该模型通过创新架构与训练方法,在编程能力与推理效率之间实现了突破性平衡,为开发者提供了更高效的智能编程工具。

基于Qwen3-Next-80B-A3B-Base架构,研发团队采用混合注意力机制与MoE(专家混合)架构,构建了新一代智能编程模型。通过大规模可执行任务合成、环境交互反馈与强化学习技术,模型在降低推理成本的同时,显著提升了代码生成与智能体交互能力。训练过程中突破传统参数扩展模式,重点强化智能体训练信号的扩展性,采用四阶段优化策略:首先在代码与智能体数据集上进行持续预训练,随后通过高质量智能体轨迹数据监督微调,接着针对软件工程、QA、Web/UX等领域开展专家训练,最终将多领域能力蒸馏至单一可部署模型。

在编程智能体基准测试中,该模型展现出强劲竞争力。使用SWE-Agent框架时,在SWE-Bench Verified基准上取得超过70%的准确率,在多语言环境及更具挑战性的SWE-Bench-Pro测试中保持领先。特别值得注意的是,尽管激活参数规模仅为3B,其性能已可媲美参数量高10-20倍的开源模型,在TerminalBench 2.0和Aider等基准测试中同样表现优异。

效率与性能的平衡优化成为该模型的核心优势。测试数据显示,在SWE-Bench-Pro基准上,3B激活参数的Qwen3-Coder-Next与参数量大数十倍的模型性能相当,在低成本智能体部署场景中占据帕累托前沿。这种突破得益于训练方法对长程推理、工具使用和错误恢复能力的针对性强化,使模型更适应真实开发环境中的复杂需求。

目前,该模型已通过ModelScope和Hugging Face平台开放下载,开发者可自由获取模型权重进行本地部署与二次开发。研发团队表示,后续将持续优化模型的推理决策能力,扩展任务支持范围,并根据用户反馈快速迭代更新,为智能编程领域提供更强大的技术支撑。

马斯克再布局:SpaceX收购xAI,为超级IPO铺路估值达1.25万亿美元
据CCTV国际时讯报道,美国东部时间2月2日,美国企业家、亿万富翁马斯克旗下的太空探索技术公司(SpaceX)发表声明,宣布已收购同属于马斯克旗下的人工智能企业xAI公司。xAI公司同时也发表声明,证明已“…

2026-02-04

科创人工智能ETF国泰(589110)2月3日开盘微涨,重仓股多数飘红表现亮眼
来源:新浪基金∞工作室 2月3日,科创人工智能ETF国泰(589110)开盘涨0.10%,报1.022元。科创人工智能ETF国泰(589110)重仓股方面,金山办公开盘涨1.04%,澜起科技涨3.86%,寒武…

2026-02-04

科创人工智能ETF广发半日涨0.72% 成交额2.16亿 重仓股表现分化
来源:新浪基金∞工作室 2月3日,截止午间收盘,科创人工智能ETF广发(588760)涨0.72%,报0.840元,成交额2.16亿元。科创人工智能ETF广发(588760)重仓股方面,金山办公截止午盘涨0.…

2026-02-04

太阳能庭院灯市场崛起:三大厂家技术优势解析与选型指南
量化核心性能参数:向厂家索取并核实产品的关键数据,包括:太阳能板类型与标称转换效率、电池的实际容量与类型(是否为低温电池)、LED光源的额定光通量与光衰曲线、防护等级(IP评级,通常需IP65以上)以及智能…

2026-02-04