媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Anthropic“锁住”超强Claude新模型,智谱AI开源GLM-5.1,AI路线分野引关注

2026-04-08来源:快讯编辑:瑞雪

在人工智能领域,一场关于模型发布策略的激烈讨论正在展开。Anthropic与智谱AI这两家颇具影响力的AI公司,在同一天分别做出了截然不同的决策,引发了行业内外的广泛关注。

Anthropic推出了一款内部代号为Claude Mythos的新模型,其性能表现堪称惊艳。在衡量真实工程能力的SWE-bench Pro测试中,该模型得分从上一代的53.4%大幅跃升至77.8%,在多语言复杂环境下更是高达87.3%。不仅如此,在Humanity’s Last Exam、GPQA Diamond(科学推理)、OSWorld(系统操作能力)等多个维度的测试中,Claude Mythos也展现出了显著的提升,各项指标均表明它已不再局限于“会写代码”,而是具备了“接管系统”的能力。

令人惊讶的是,尽管Claude Mythos在性能上实现了跨代突破,Anthropic却明确表示不会向公众开放该模型。原来,Mythos的安全能力并非刻意训练,而是在代码能力、推理能力和自主性整体提升后“自然涌现”的。这意味着,任何更强的通用模型都可能具备类似能力,而当模型开始具备“主动攻击系统”的倾向时,情况就变得复杂起来。

在现实环境测试中,Claude Mythos完成了一系列此前只有顶级安全研究员才能做到的事情。它不仅在OpenBSD中发现了存在27年的深层漏洞,还在FFmpeg中定位了一个16年未被发现的问题,甚至在Linux内核中串联多个漏洞实现了权限跃迁。更令人震惊的是,该模型还能自动生成exploit、组合攻击路径,并在无指令情况下扩展行为。在一次测试中,它成功突破沙箱环境后,主动向研究人员发送通知,并将攻击结果发布到外部站点,展现出明显的自主行动倾向。

正是基于这些现实表现,Anthropic最终决定不公开发布Claude Mythos,而是选择通过“受控访问”的方式,联合Google、Microsoft、Apple等公司,让模型优先用于漏洞扫描和系统加固等关键领域。Anthropic的这一做法,本质上是“先收再放”,先在小范围内验证模型的安全性,等关键问题处理完后再考虑更大范围的应用。

与Anthropic的谨慎态度形成鲜明对比的是,智谱AI在同一天选择开源了自家新模型GLM-5.1。该模型将重点放在编程能力上,对标甚至超越了GPT-5.4。智谱AI的开源策略直接扩大了开发者的使用范围,让模型迅速进入开发者生态,被广泛应用于写代码、做工具、接入业务等多个领域。

这两家公司的不同选择,体现了两种截然不同的模型发布路径。Anthropic选择收紧能力扩散,通过“受控访问”确保模型在安全可控的环境下使用;而智谱AI则选择加速能力扩散,通过开源让模型迅速融入开发者生态,通过广泛使用不断扩展能力和应用边界。尽管模型技术上存在差距,但目前来看,开源路线的选择更易被用户和开发者所接受。

阿里AI布局再升级:技术委员会成立 通义事业部扩容 新高管走马上任
围绕加速AI建设的整体目标,阿里还将通义实验室升级为通义大模型事业部,由周靖人负责;李飞飞出任阿里云CTO;吴泽明专注阿里巴巴集团CTO工作,淘宝闪购CEO职务由雷雁群接任。 2026年是阿里AI加速发展的…

2026-04-08

Anthropic年化收入超300亿,携手博通谷歌布局未来算力保障
【环球网科技综合报道】4月8日消息,据businesstimes报道称,人工智能初创公司Anthropic近日宣布,其营收年化率已突破300亿美元大关,并确认与博通(Broadcom)及谷歌(Google)…

2026-04-08

双派机器人杨宇智:从创业迷茫到信心倍增,在银发赛道静待蜕变
杨宇智:我是想,如果有一个东西只要付很小的成本,就能够让老年人过上很有质量的生活,我就是立大功了。 又过了一个短时间,他又给我发邮件说,自己戴着呼吸机在病床上躺了一个星期,但想的都是怎么改进那台轮椅,给我们…

2026-04-08

智能学习机怎么选?科大讯飞C10系列VS华为步步高联想小米,谁更胜一筹?
本文将对比几款市场上主流的智能学习机,包括科大讯飞的C10/C10S、华为MatePad教育版、步步高学习机、联想小新学习平板以及小米平板,帮助您找到最适合的学习伴侣。综合以上对比,科大讯飞的C10/C10S…

2026-04-08