媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

蚂蚁百灵Ling-2.6-flash模型揭晓:高效推理,百万字长篇轻松生成

2026-04-22来源:快讯编辑:瑞雪

蚂蚁集团旗下百灵团队近日宣布,其研发的Instruct模型Ling-2.6-flash正式对外发布。这款总参数量达104B、激活参数7.4B的模型此前以匿名形式在OpenRouter平台测试,连续多日占据热榜首位,日均tokens调用量突破百亿级别,引发开发者社区广泛关注。

技术团队通过引入混合线性架构,使模型在4卡H20硬件环境下实现每秒340tokens的推理速度,Prefill吞吐量达到同类产品Nemotron-3-Super的2.2倍。在token效率优化方面,该模型在Artificial Analysis完整评测中仅消耗15M tokens,较主流模型降低90%以上,形成显著的智效比优势。针对Agent场景的定向增强训练,使其在工具调用、多步规划等核心能力上达到同尺寸模型领先水平。

实测数据显示,在前端开发任务中,模型能自动规划网站核心组件并添加明暗模式切换等扩展功能,1分钟内完成原型开发。当用户要求修改主色调时,模型可在10秒内精准定位并调整相关代码,较传统模型几分钟的修改耗时形成质的飞跃。在长文本生成场景,基于该模型的长篇写作助手可实现每秒200+tokens的稳定输出,百万字级作品仅需数十分钟即可完成。

架构设计层面,研发团队在Ling 2.0基础上创新采用MLA+Lightning Linear混合架构,配合高度稀疏化的MoE架构,使模型在长上下文处理场景中保持优势。通过系统性优化BF16、FP8等精度模式的推理链路,模型在真实交互场景中的系统吞吐和单用户TPS显著提升,首字响应时间缩短至行业领先水平。

在强化学习训练阶段,团队构建大规模高保真交互环境,重点提升模型的指令遵循、工具调用和长程执行能力。评测数据显示,该模型在BFCL-V4、TAU2-bench等专业榜单中表现优异,在Claude Code、Kilo Code等主流开发框架中展现出良好兼容性。尽管在复杂指令遵循和中英双语切换方面仍有优化空间,但其在通用知识、数学推理等基础能力上已对齐国际顶尖水平。

目前,Ling-2.6-flash已在OpenRouter平台及官方渠道开放免费API调用服务,首周提供全量免费额度,后续将维持每日50万tokens的免费配额,超出部分按输入0.6元/百万tokens、输出1.8元/百万tokens计费。BF16、FP8、INT4等量化版本将于近期开源,为开发者提供更多部署选择。

DDC控制器与末端传感器:让建筑能源管理实现“感知-思考-动作”闭环
这种策略将离散的感知信息整合为对空间使用状态的判断,从而触发系列设备动作。 将视角提升至整栋建筑的运行层面,广泛分布的DDC控制器与末端传感器网络,构成了一个持续产生运行数据的源。DDC控制器与末端传感器的集…

2026-04-22

大连化物所携手企业研发“高效制氢加氢一体机” 成果获权威鉴定认可
上证报中国证券网讯(记者 韩远飞)4月21日,中国科学院大连化物所发布消息,日前,由该所邓德会研究员、刘艳廷副研究员团队与国科绿氢(大连)科技有限公司合作研发的“高效制氢加氢一体机”技术,通过了中国石油和化学…

2026-04-22

阿里巴巴(09988)“千问小酒窝”亮相,生态级AI助手赋能工作生活全场景
智通财经APP获悉,阿里巴巴(09988)今日正式发布生态级AI助手“千问小酒窝”。作为阿里千问AI的统一数字人形象,其不仅在千问App中,未来将陆续接入淘宝、飞猪等阿里生态各应用,成为覆盖工作与生活场景的统…

2026-04-22

阿里千问“小酒窝”数字人上线,一站式服务覆盖工作生活全场景
大象新闻·大象财富记者 李莉 张迪驰4月22日,阿里巴巴正式发布生态级AI助手数字人形象——千问“小酒窝”。在千问App中找到“小酒窝”,不论做规划、解难题,还是订餐、买票、打车,都能在简单对话中完成。 大…

2026-04-22

大模型产业竞争转向场景落地:中关村科金凭何跻身第一梯队?
这些数字员工能够跨系统操作,直接完成从知识检索、报告生成到流程审核、客户触达等具体任务,从而在智能审核、客服、知识管理三大赛道形成闭环交付能力。 中关村科金的入围,标志着大模型产业评价体系的一次刷新:未来的领…

2026-04-22

阿里生态级AI助手“千问小酒窝”登场 加速AI生态融合新进程
作为阿里千问AI的统一数字人形象,这位智慧伙伴不仅在千问App中,接下来也会在阿里生态各应用中,为用户提供统一、便捷的智能体验,阿里AI生态融合持续加速。 随着生态打通的深入,除了千问App原生入口,“千问小…

2026-04-22