小米大模型团队音频推理突破，一周登顶MMAU榜，GRPO算法显神威！-行业纵横-媒体界

小米大模型团队近日宣布，在音频推理技术方面取得了显著进步。该团队受DeepSeek-R1项目的启发，成功将强化学习算法应用于多模态音频理解任务，这一创新实践仅耗时一周，便在国际权威的MMAU音频理解评测中取得了64.5%的准确率，成功登顶榜首，并且已经同步开源。

据悉，DeepSeek-R1项目中提出的Group Relative Policy Optimization（GRPO）方法，使得模型能够通过“试错-奖励”机制自主进化，展现出类似人类的反思和多步验证等高级推理能力。小米团队受此启发，尝试将GRPO算法迁移到自家的Qwen2-Audio-7B模型上，取得了令人瞩目的成果。

在训练样本方面，小米团队仅使用了AVQA数据集中的3.8万条样本进行强化学习微调，便在MMAU评测集上实现了64.5%的准确率。这一成绩不仅刷新了记录，而且相比目前榜单上排名第一的商业闭源模型GPT-4o，有近10个百分点的优势。

尽管取得了如此显著的进步，但小米团队表示，当前模型的准确率距离人类专家的82%水平仍有差距。他们将继续努力，不断优化算法和模型，以期达到更高的准确率。

在官方提供的交互demo中，小米团队选择了雷军2015年“R U OK”的视频作为默认分析对象，展示了模型在实际应用中的表现。这一选择不仅富有趣味性，也体现了小米团队对于用户需求和场景理解的深入洞察。

小米技术官微在发布这一消息时表示，音频推理技术的突破将为智能语音助手、智能家居等领域带来更加智能和人性化的体验。他们期待与更多合作伙伴共同探索这一技术的广阔应用前景。

小米团队还强调了开源的重要性。他们认为，通过开源可以吸引更多开发者参与到技术的创新和优化中来，共同推动人工智能技术的发展和进步。

拟港股上市的华曦达亮相IBC盛会，以AI Home生态引领未来家庭智慧生活

2025-10-23

美澳欲绕开中国建稀土产业链？专家：提炼技术难关难破，绕不开中国

2025-10-23

2025年AI应用赛道融资新高峰：LiblibAI获1.3亿美元B轮融资引领应用层崛起

2025-10-23

高中生提分难？学魁清北分层学习法，打破低效学习怪圈！

“明明很努力，成绩却不见涨”“补了很多课，还是没找到提分窍门”，这是很多高中生和家长共同的烦恼。高中生每天埋首于书山题海，周末还要在各个补习班之间奔波，可付出的努力与收获的成绩往往不成正比。究其根本，是传统学习和补课模式存在诸多弊端，无法满足高中生个

2025-10-23

智力竞技职业化加速——德信竞技观察中国智力运动选手成长新路径

职业化浪潮来临：智力运动员的崛起在体育多元化发展的当下，智力竞技正逐渐成为新的职业方向。从围棋到国际象棋，再从德州扑克到桥牌，越来越多年轻人选择以此为生。德信竞技数据显示，截至2024年底，中国登记在册的职业智力运动员已超过1.8万人，比2019年增长近60%。这

2025-10-23

环球新材国际获南向资金持续加仓近20日累计增持超2800万股

2025-10-23

巴西大豆对华报价飙升，中国买家按兵不动：静候新豆上市与中美贸易新变局

2025-10-21

抖音电商持续治理虚假宣传保健功效，清退违规达人4.3万名，违规商家793家

10月20日，抖音电商安全与信任中心发布治理虚假宣传保健功效的进展，公告称多平台反复出现以“健康焦虑”为卖点的功效虚假宣传现象，已成为食品行业的顽疾。据了解，部分不良商家、达人将普通食品包装为“保健品”或“特医食品”，甚至将保健食品夸大为具有医疗功效，损

2025-10-21

东莞至阿根廷国际空运：高效安全之选，助力企业快速响应市场

2025-10-21

2025北京国际风能大会启幕，北京建工新型建材C110模型受瞩目

2025-10-21