媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

2025年5月大模型测评报告:豆包1.5与商汤日日新V6并驾齐驱领跑国内

2025-05-30来源:ITBEAR编辑:瑞雪

近日,备受瞩目的SuperCLUE发布了其最新的《中文大模型基准测评报告》,该报告详细阐述了2025年5月份中文大模型的最新表现。

在此次测评中,豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)与商汤日日新V6多模态模型(SenseNova-V6 Reasoner)脱颖而出,成功夺得金牌,将Gemini 2.5 Flash Preview甩在身后,领跑国内大模型的第一梯队。

紧随其后的是第二梯队的大模型们,包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1和DeepSeek-V3,它们虽然在本次测评中未能摘得金牌,但同样展现出了不俗的实力。

据报告分析,国内外第一梯队大模型在中文领域的通用能力差距正在逐渐缩小,这对于国产大模型来说无疑是一个好消息。其中,Doubao-1.5-thinking-pro-205415和SenseNova V6 Reasoner的表现尤为抢眼,它们在多个测评任务中都展现出了卓越的能力。

本次SuperCLUE的测评报告聚焦大模型的通用能力,涵盖了数学推理、科学推理、代码生成、智能体Agent、精确指令遵循以及文本理解与创作六大任务,总计1579道多轮简答题。这些任务全面考察了大模型在不同场景下的应用能力和表现。

SuperCLUE作为行业权威的通用大模型综合性测评基准,其发布的报告一直备受关注。此次报告的发布,不仅揭示了当前中文大模型的最新发展态势,也为未来大模型的研究和应用提供了重要的参考依据。

周鸿祎2026AI趋势展望:百亿智能体时代来临,社会经济将迎深刻变革
1月9日,360集团创始人周鸿祎在其个人社交平台发布题为《2026年AI全景预测:迈向百亿智能体时代的20个发展趋势》的重磅观点,系统提出对人工智能未来一年发展的二十大核心预测。百亿级智能体将全面融入经济社…

2026-01-09

乐聚机器人牵手阿里云 共探全栈AI赋能人形机器人多元场景新路径
1月8日,,双方将基于阿里云算力、AI平台、千问模型,共同开展人形机器人训练场合作,以及探索基于千问模型的具身智能联合解决方案和人形机器人产品的开发。 当日,乐聚智能(深圳)股份有限公司常务副总裁柯真东与阿里…

2026-01-09

AI硬件隐私保护新突破!YoooTek与阿里云无影共筑Glass-Box安全架构
在阿里云通义智能硬件展上,新锐科技消费品品牌 YoooTek与阿里云无影联合重磅发布 Glass-Box隐私可信计算架构,以期通过底层技术创新,为 AI 时代的个人数据主权构建物理级护城河,让AI硬件既“…

2026-01-09

漕河泾开发区“四位一体”服务赋能,MiniMax上市书写AI产业新传奇
漕河泾开发区联合MiniMax等企业打造的“AI+广告”等创新平台,将其底层大模型能力转化为园区公共服务,既赋能众多中小企业,也为MiniMax创造了规模化落地场景。漕河泾开发区,通过其 “空间运营 + 产…

2026-01-09

互联网时代新大众文艺:丰富生活、展现气象、激发活力的新力量
第一,新大众文艺是丰富人民精神文化生活的新途径。新大众文艺是互联网时代的产物,文艺和科技融合创新是其鲜明特征。 新大众文艺是一个蓬勃发展的新事物,在发展过程中也伴随着流量至上、内容同质化、过度娱乐化等问题,…

2026-01-09