Meta闭源新篇：Muse Spark“偏科”逆袭，AI赛道开启新角逐？-资讯速递-媒体界

meta全新大模型Muse Spark的登场，犹如一颗重磅炸弹投入科技圈，激起层层涟漪。这款内部代号为Avocado的模型，不仅是meta超级智能实验室（MSL）成立9个月后的首个成果，更是扎克伯格在经历Llama 4的挫折后，大刀阔斧进行组织与战略调整后的首份答卷。令人意外的是，曾经高举“开源对抗闭源”大旗的meta，此次给Muse Spark贴上了“闭源”标签，API也仅向少数指定合作伙伴开放预览。

回顾Llama 4的发布，可谓开局不利。它承载着meta的厚望，却很快陷入信誉危机。社区质疑声不断，更有爆料称meta在基准测试中弄虚作假，用针对特定任务微调的“特供版”刷榜，而普通用户使用的版本表现大相径庭。这一事件对meta AI品牌造成了致命打击，就连图灵奖得主、meta前首席科学家Yann LeCun离职后也承认，Llama 4的测试结果“确实被修饰了一点”。

扎克伯格对此怒不可遏，据外媒报道，他对相关人员失去信心，直接架空了整个生成式AI团队，大批人员离开。这不仅仅是某个模型的失败，更意味着过去从模型架构到研发流程，从开源路线到组织文化的道路可能都行不通了。扎克伯格面临艰难抉择，最终选择全部推翻，在废墟上重建。

2025年夏天，扎克伯格做出震惊硅谷的决策，以143亿美元的天价拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是，时年不到30岁的华裔创始人Alexandr Wang被请进meta，出任首席AI官，统管全新组建的MSL。这位MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪行列的年轻人，被扎克伯格评价为“同辈创业者中最杰出的一位，深刻理解超级智能的历史重要性”。

Alexandr Wang上任后雷厉风行，从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里，以天价薪酬挖来一整支“复仇者联盟”。翻看MSL首批11人名单，7位核心研究员都有华人背景，包括浙大校友毕树超、清华校友赵晟佳、中科大校友于佳慧等业内顶尖高手。这支“亿元天团”的目标明确，就是从零开始，重写meta的AI命运。

Muse Spark究竟实力如何？meta此次态度格外坦诚，在官方博客里列出了一张优缺点分明的成绩单。在医疗和视觉多模态领域，Muse Spark表现堪称惊艳。在极高难度的医学开放式问答评测HealthBench Hard中，它取得42.8分，而GPT - 5.4只有40.1分，Gemini 3.1 Pro仅20.6分，差距明显。这得益于meta与超过1000名专业医生合作整理训练数据，为模型配备了强大的专家顾问团。在科研论文图表的深度理解测试（CharXiv Reasoning）中，Muse Spark以86.4分力压GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的应用场景也十分丰富。官方案例显示，对着食物拍照，它能分析出每种食物的卡路里；能识别瑜伽动作，指出发力肌群并纠正姿态；甚至还会操作咖啡机。可以想象，若应用在AI眼镜上，将带来极大便利。

然而，Muse Spark并非完美无缺。在纯逻辑推理和代码编程方面，它的表现不尽如人意。在ARC AGI 2抽象推理测试中，仅拿到42.5分，与Gemini 3.1 Pro（76.5分）和GPT - 5.4（76.1分）差距巨大。在软件工程实测（SWE - bench Pro）中，通过率（52.4%）也略逊于GPT - 5.4的57.7%。

Muse Spark背后真正令人瞩目的，是meta公布的一项技术数据。在新重建的技术栈下，它达到与上一代Llama 4 Maverick同等性能水平所需的计算量，减少了超过一个数量级，实现了10倍以上的效率跃升。这得益于MSL团队提出的“思维压缩”（Thought Compression）核心技术。在强化学习训练阶段，引入“思考时间惩罚”机制，模型回答问题时若思考过久就会被“扣分”，从而被迫进化，学会用更少的推理token、更短的逻辑链条解决复杂问题，且准确率不降反升。Muse Spark还推出多Agent并行推理的“沉思模式”（Contemplating Mode），传统推理模式是一个模型独自思考，而它是同时拉起多个子智能体处理不同维度信息后汇总，在相近响应时间内，在Humanity‘s Last Exam等评测中表现出色。

Muse Spark虽不完美，但用9个月时间将meta从Llama 4的舆论困境中拉出，重新回到与GPT - 5.4、Gemini 3.1 Pro同场竞技的第一梯队。对于扎克伯格和这支“华人天团”来说，它更像是一个宣言，标志着靠开源攒口碑的meta已成为过去，一个更务实、更有技术野心的新meta正崭露头角。

小米食堂上新“小米”冰激凌三版本，雷军笑称员工抢购自己忙未尝

2026-04-10

新一轮储蓄国债发售引抢购热潮，大行APP渠道1分钟售罄，低利率下受青睐

2026-04-10

Meta超级智能实验室首秀：Muse Spark上线，开启个人超级智能新篇章

为此，Meta 从三个维度对 Muse Spark的规模化能力进行研究与跟踪：预训练、强化学习，以及测试时推理。左图中可以看到，在训练数据上，pass@1 和 pass@16（即 16 次尝试中至少成功一次…

2026-04-10

微信严打AI自动化创作：夫妻用AI写公众号年入200万引热议后平台出手规范

近期，平台关注到利用自动化工具替代真人创作的行为，《微信公众平台运营规范》再次明确：公众号和服务号不得利用AI、脚本、接口或其他自动化方式，替代真人完成内容创作、发布等流程，也不得传播、推广此类自动化创作的教…

2026-04-10

西部创业2025年业绩快报：营收微降1.2% 净利润却增11.24%

2026-04-10

阿里HappyHorse视频模型内测，API将上线，多项指标超字节Seedance 2.0

蓝鲸新闻4月10日讯 4月10日，阿里巴巴方面确认，近期备受关注的HappyHorse视频模型系其推出。ATH创新事业部已启动一个AI时代的全新交互方式探索计划，HappyHorse是这个探索方向的一部分，更…

2026-04-10

阿里巴巴研发的HappyHorse-1.0登顶AI Video Arena多领域排行榜

钛媒体App 4月10日消息，综合多方获悉，业内备受关注的视频模型HappyHorse-1.0确系阿里巴巴研发，由前快手副总裁、可灵技术负责人张迪带队，他于2025年11月回归阿里。此外，阿里云将很快将该模型…

2026-04-10

“杭州六小龙”领航者群核科技启动招股拟登陆港交所开启空间智能新篇章

2026-04-10

Create2026百度AI开发者大会将启，全景展示AI新突破与多元应用场景

开幕式上，百度创始人李彦宏将发表主题演讲，分享最新AI趋势判断；2场主论坛由百度智能云承办，“技术与产品”主论坛将发布百度全栈AI产品进展，深度解码AI价值落地全路径，助力企业迈向Agent时代，“超级个体”…

2026-04-10

阿米巴经营实战72问揭秘：从理念到落地，中小企业管理新思路

2026-04-10