媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Meta闭源新篇:Muse Spark“偏科”逆袭,AI赛道开启新角逐?

2026-04-10来源:快讯编辑:瑞雪

meta全新大模型Muse Spark的登场,犹如一颗重磅炸弹投入科技圈,激起层层涟漪。这款内部代号为Avocado的模型,不仅是meta超级智能实验室(MSL)成立9个月后的首个成果,更是扎克伯格在经历Llama 4的挫折后,大刀阔斧进行组织与战略调整后的首份答卷。令人意外的是,曾经高举“开源对抗闭源”大旗的meta,此次给Muse Spark贴上了“闭源”标签,API也仅向少数指定合作伙伴开放预览。

回顾Llama 4的发布,可谓开局不利。它承载着meta的厚望,却很快陷入信誉危机。社区质疑声不断,更有爆料称meta在基准测试中弄虚作假,用针对特定任务微调的“特供版”刷榜,而普通用户使用的版本表现大相径庭。这一事件对meta AI品牌造成了致命打击,就连图灵奖得主、meta前首席科学家Yann LeCun离职后也承认,Llama 4的测试结果“确实被修饰了一点”。

扎克伯格对此怒不可遏,据外媒报道,他对相关人员失去信心,直接架空了整个生成式AI团队,大批人员离开。这不仅仅是某个模型的失败,更意味着过去从模型架构到研发流程,从开源路线到组织文化的道路可能都行不通了。扎克伯格面临艰难抉择,最终选择全部推翻,在废墟上重建。

2025年夏天,扎克伯格做出震惊硅谷的决策,以143亿美元的天价拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是,时年不到30岁的华裔创始人Alexandr Wang被请进meta,出任首席AI官,统管全新组建的MSL。这位MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪行列的年轻人,被扎克伯格评价为“同辈创业者中最杰出的一位,深刻理解超级智能的历史重要性”。

Alexandr Wang上任后雷厉风行,从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里,以天价薪酬挖来一整支“复仇者联盟”。翻看MSL首批11人名单,7位核心研究员都有华人背景,包括浙大校友毕树超、清华校友赵晟佳、中科大校友于佳慧等业内顶尖高手。这支“亿元天团”的目标明确,就是从零开始,重写meta的AI命运。

Muse Spark究竟实力如何?meta此次态度格外坦诚,在官方博客里列出了一张优缺点分明的成绩单。在医疗和视觉多模态领域,Muse Spark表现堪称惊艳。在极高难度的医学开放式问答评测HealthBench Hard中,它取得42.8分,而GPT - 5.4只有40.1分,Gemini 3.1 Pro仅20.6分,差距明显。这得益于meta与超过1000名专业医生合作整理训练数据,为模型配备了强大的专家顾问团。在科研论文图表的深度理解测试(CharXiv Reasoning)中,Muse Spark以86.4分力压GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的应用场景也十分丰富。官方案例显示,对着食物拍照,它能分析出每种食物的卡路里;能识别瑜伽动作,指出发力肌群并纠正姿态;甚至还会操作咖啡机。可以想象,若应用在AI眼镜上,将带来极大便利。

然而,Muse Spark并非完美无缺。在纯逻辑推理和代码编程方面,它的表现不尽如人意。在ARC AGI 2抽象推理测试中,仅拿到42.5分,与Gemini 3.1 Pro(76.5分)和GPT - 5.4(76.1分)差距巨大。在软件工程实测(SWE - bench Pro)中,通过率(52.4%)也略逊于GPT - 5.4的57.7%。

Muse Spark背后真正令人瞩目的,是meta公布的一项技术数据。在新重建的技术栈下,它达到与上一代Llama 4 Maverick同等性能水平所需的计算量,减少了超过一个数量级,实现了10倍以上的效率跃升。这得益于MSL团队提出的“思维压缩”(Thought Compression)核心技术。在强化学习训练阶段,引入“思考时间惩罚”机制,模型回答问题时若思考过久就会被“扣分”,从而被迫进化,学会用更少的推理token、更短的逻辑链条解决复杂问题,且准确率不降反升。Muse Spark还推出多Agent并行推理的“沉思模式”(Contemplating Mode),传统推理模式是一个模型独自思考,而它是同时拉起多个子智能体处理不同维度信息后汇总,在相近响应时间内,在Humanity‘s Last Exam等评测中表现出色。

Muse Spark虽不完美,但用9个月时间将meta从Llama 4的舆论困境中拉出,重新回到与GPT - 5.4、Gemini 3.1 Pro同场竞技的第一梯队。对于扎克伯格和这支“华人天团”来说,它更像是一个宣言,标志着靠开源攒口碑的meta已成为过去,一个更务实、更有技术野心的新meta正崭露头角。

Meta超级智能实验室首秀:Muse Spark上线,开启个人超级智能新篇章
为此,Meta 从三个维度对 Muse Spark的规模化能力进行研究与跟踪:预训练、强化学习,以及测试时推理。左图中可以看到,在训练数据上,pass@1 和 pass@16(即 16 次尝试中至少成功一次…

2026-04-10

微信严打AI自动化创作:夫妻用AI写公众号年入200万引热议后平台出手规范
近期,平台关注到利用自动化工具替代真人创作的行为,《微信公众平台运营规范》再次明确:公众号和服务号不得利用AI、脚本、接口或其他自动化方式,替代真人完成内容创作、发布等流程,也不得传播、推广此类自动化创作的教…

2026-04-10

阿里HappyHorse视频模型内测,API将上线,多项指标超字节Seedance 2.0
蓝鲸新闻4月10日讯 4月10日,阿里巴巴方面确认,近期备受关注的HappyHorse视频模型系其推出。ATH创新事业部已启动一个AI时代的全新交互方式探索计划,HappyHorse是这个探索方向的一部分,更…

2026-04-10

阿里巴巴研发的HappyHorse-1.0登顶AI Video Arena多领域排行榜
钛媒体App 4月10日消息,综合多方获悉,业内备受关注的视频模型HappyHorse-1.0确系阿里巴巴研发,由前快手副总裁、可灵技术负责人张迪带队,他于2025年11月回归阿里。此外,阿里云将很快将该模型…

2026-04-10

Create2026百度AI开发者大会将启,全景展示AI新突破与多元应用场景
开幕式上,百度创始人李彦宏将发表主题演讲,分享最新AI趋势判断;2场主论坛由百度智能云承办,“技术与产品”主论坛将发布百度全栈AI产品进展,深度解码AI价值落地全路径,助力企业迈向Agent时代,“超级个体”…

2026-04-10