4月8日,智谱正式推出并开源其最新一代智能模型GLM-5.1,这款被公司称为“迄今最强”的模型在长程任务处理能力上实现重大突破。据测试数据显示,GLM-5.1可在单次任务中持续自主运行8小时,这一特性使其在SWE-bench Pro软件开发基准测试中刷新全球纪录,首次超越Claude Opus 4.6等国际顶尖模型。
在同期举行的AIFUT大会上,智谱CEO张鹏坦言国产大模型与国际顶尖水平仍存在差距。“我们过去在基础研究和技术积累上欠账太多,现在需要以更快的速度追赶。”他透露,当前国产头部模型与全球领先者的差距约在半年至一年之间。零一万物CEO李开复也持类似观点,认为中美顶尖模型的技术代差约为6-9个月。
市场数据却呈现出另一番景象。OpenRouter统计显示,2026年3月第三周至第四周,中国AI大模型周调用量从7.36万亿Token激增至9.857万亿Token,涨幅达33.94%,连续四周超越美国同期3.007万亿Token的调用规模。这种量级差距的持续扩大,引发业界对中国模型应用落地能力的重新评估。
张鹏在演讲中特别强调2026年将成为AI Agent的“应用爆发年”。他指出,智能体的普及并非单纯依赖模型参数突破,而是需要工程架构、系统工具链与模型能力的协同进化。这种判断源于智谱对技术发展阶段的划分:从GPT-3时期的知识压缩,到DeepSeek阶段的资源优化,当前已进入推理与自学习的新阶段。
定价策略的调整折射出市场格局变化。GLM-5.1发布后,智谱将API价格上调10%,其编码场景定价已与Anthropic旗下Claude Sonnet4.6持平。在行业普遍降价争夺市场份额的背景下,这一反常举动被解读为技术自信的体现。张鹏解释称,公司需要通过差异化定价策略,引导市场关注模型解决复杂任务的能力而非单纯价格竞争。
智谱内部设立的Lab创新实验室引发关注。这个负责前沿探索的部门被赋予“保持技术多样性”的使命,研究范围涵盖神经网络优化、软硬件接口打通等基础领域。张鹏透露,实验室采取“中短期路径明确、长期保持开放”的运作模式,确保公司在应用落地与基础研究间保持平衡。
行业观察人士指出,GLM-5.1的发布与定价策略调整,某种程度上反映了中国大模型在国际竞争中的定位转变。从技术追赶者到应用场景定义者,这种角色转换或将重塑全球AI产业格局。但如何将调用量优势转化为持续的技术领先,仍是摆在所有中国厂商面前的共同课题。