媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

微博15亿参数小模型VibeThinker:7800美元成本,数学赛场逆袭“大块头”

2025-11-21来源:快讯编辑:瑞雪

当全球AI领域陷入“参数至上”的激烈竞争时,微博AI团队以一场颠覆性突破,为行业开辟了全新的发展路径。近日,微博正式推出自主研发的开源大模型VibeThinker,这款仅含15亿参数的“轻量级选手”,在国际权威数学竞赛基准测试中,以惊人表现击败了参数规模达6710亿的DeepSeek R1模型,引发全球AI研究界的广泛关注。

在传统认知中,AI模型的参数量被视为衡量其能力的核心指标。行业普遍认为,复杂推理能力需要千亿级参数支撑,小模型因参数不足难以应对高难度任务。然而,微博AI团队通过优化模型架构与训练范式,创新提出“频谱到信号原理”(SSP)训练方法,成功挖掘出小模型的隐藏潜力。VibeThinker在AIME24、AIME25及HMMT25等高难度数学测试中,表现超越参数量超其400倍的DeepSeek-R1-0120版本,与4560亿参数的MiniMax-M1效果相当,甚至可媲美Gemini 2.5 flash和Claude Opus 4等顶尖模型。在编程算法测试集LiveCodeBench v6中,其成绩也追平了欧洲领先AI企业Minstral.AI的Magistral-Medium-2506版本。

这一突破不仅重新定义了AI模型的评价标准,更以极致的成本效益颠覆了行业格局。据公开数据,2025年主流大模型单次后训练成本普遍在数十万美元级别。例如,上海AI企业MiniMax今年6月发布的M1模型,训练成本约53.5万美元;DeepSeek的R1模型训练总成本(含基础模型开发)约630万美元。相比之下,VibeThinker的后训练过程(含SFT和RL阶段)仅消耗3900个GPU小时,按市场租赁价格计算,总成本仅7800美元,成本效益比达到30至60倍。这一优势意味着,前沿AI技术不再为科技巨头所垄断,中小型机构和研究团队也能以极低门槛参与创新,推动行业向更开放、多元的方向发展。

技术突破的最终价值在于落地应用。微博已将AI技术深度融入平台生态,构建起覆盖多场景的智能服务体系。2024年,微博自主研发的“知微”大语言模型通过备案,并陆续推出智搜、内容总结、AI互动号等功能。其中,微博智搜通过分析平台海量内容构建可信知识图谱,实现精准需求捕捉与情感场景理解,6月月活跃用户突破5000万;评论罗伯特作为AI互动账号,从毒舌风格进化出温情与聪明版本,全网粉丝近200万,成为用户热议的交流对象。

随着VibeThinker的发布,微博AI战略迈入新阶段。公司计划深度融合心理等垂直领域的数据资产,打造更懂公众情绪、更能服务社会需求的专属模型。这一模型不仅将优化现有AI产品体验,更可能裂变出兼具社交属性与智能服务的全新生态。例如,VibeThinker的技术有望降低微博智搜的算力损耗和实时互动场景的AI响应成本,使平台在规模化投入AI能力时无需承担过高资源压力,进一步释放生态创新能力。

目前,VibeThinker仍处于实验性版本阶段,其研发重点聚焦于强化小模型在数学与编程领域的能力,尚未针对日常聊天等场景进行优化。但这一探索已为AI产业提供了全新思路:通过算法创新而非单纯堆砌参数,小模型同样能实现高性能与低成本的双赢,为行业从“规模竞赛”转向“效率革命”奠定基础。

亚马逊与伊利诺伊大学创新突破:让AI助手“牢记”复杂规则高效工作
研究团队特意让GTAPolicy的训练数据非常有限,只有几百个例子,这就像让员工在信息很少的情况下学会工作技能,这样更能测试AI助手的真实学习能力。研究团队担心AI助手在专门学习工作规则的过程中,会不会损失…

2025-11-21

2025乌镇峰会圆满收官:聚焦数智未来,发布多份成果助力全球共享红利
2025年世界互联网大会乌镇峰会吸引了来自130多个国家和地区的1600多名嘉宾现场参会。 峰会期间还发布了《携手构建网络空间命运共同体十年回顾与展望》《中国互联网发展报告2025》《世界互联网发展报告20…

2025-11-21

罗福莉官宣加盟小米MiMo团队!AGI愿景下或发力世界模型与具身智能
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-21

AI迈向“效果涌现”新阶段,李彦宏:百度成果频出引领健康产业格局
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-21

DLR研究:针织钢丝网PTL助力绿色制氢,性能效率双提升
-在2A cm-2时降低了74mV的电池电压,这意味着在苛刻的条件下更低的能量使用。 针织钢丝网PTL的行为就像精密工程的弹簧,在压缩下适应,均匀分布夹紧力,并保持与催化剂层的可靠接触。针织钢丝网提供了柔韧…

2025-11-21

豪鹏科技固态电池技术突破:固液态达950Wh每升 全固态2026年将试产
11月13日,豪鹏科技(001283.SZ)在深交所互动易上表示,公司固态技术研发覆盖聚合物/氧化物/硫化物三大固态主流路线,重点聚焦消费级AI终端场景,在AI端侧产品定型过程中并行三条固态技术路线,协助产…

2025-11-21

工业热电阻技术先锋:上海科戈电子以创新实力领跑行业赛道
在工业自动化仪表领域,热电阻作为温度测量的核心元件,其技术精度与稳定性直接影响生产流程的可靠性。其完整的研发体系、全场景产品矩阵与严格的质量管控,不仅为工业温度测量提供了可靠解决方案,更推动着整个行业向更高…

2025-11-21