媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

阿里发布万亿参数千问旗舰推理模型Qwen3-Max-Thinking 性能效率双提升

2026-01-27来源:快讯编辑:瑞雪

阿里巴巴正式推出其最新研发的千问旗舰推理模型Qwen3-Max-Thinking,标志着该公司在人工智能领域又迈出重要一步。这款模型拥有超过万亿参数,预训练数据量达到36T Tokens,成为阿里迄今为止规模最大、性能最强的推理模型。

开发者现在可以通过QwenChat平台免费体验Qwen3-Max-Thinking模型,企业用户则可通过阿里云百炼平台获取该模型的API服务。普通用户也能在千问PC端和网页端试用这一强大模型,千问APP也即将完成新模型的接入,届时所有用户均可免费体验其卓越性能。

在性能方面,Qwen3-Max-Thinking表现尤为突出。预览版模型已在数学推理AIME 25和HMMT 25测试中斩获国内首个双满分,展现了惊人的推理能力。经过更大规模的强化学习后训练,正式版模型的性能得到全面提升,特别是在推理效率方面实现了重大突破。

该模型采用了一种创新的测试时扩展(Test-time Scaling)机制,能够从之前的推理结果中提取"经验"并进行多轮自我迭代。这种机制避免了传统推理计算中常见的冗余推导,在相同上下文中实现了更高效的推理计算,从而获得更智能的推理结果。基于这一技术创新,千问在"人类最后的测试"HLE中取得58.3分的优异成绩,远超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,创下当前所有模型的最高分。

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还显著增强了自主调用工具的原生Agent能力。这一改进使模型能够更自主地完成复杂任务,为未来智能应用的发展奠定了坚实基础。

在太空应用领域,千问大模型也取得了突破性进展。2025年11月,国星宇航成功将千问Qwen3大模型部署至"星算"计划01组太空计算中心,这是全球首次实现在轨运行的卫星上部署通用大模型。该模型在太空中成功执行多次端到端推理任务,从地面上传问题到卫星,由大模型完成在轨推理,再将结果数据回传地面,整个过程耗时不到2分钟。

在开源社区方面,千问系列模型同样表现亮眼。全球最大AI开源社区Hugging Face最新数据显示,阿里千问衍生模型数量已突破20万个,成为全球首个达成此目标的开源大模型。同时,千问系列模型下载量突破10亿次,平均每天被下载110万次,下载量已全面超越美国Llama模型,稳居开源大模型全球第一的位置。

阿里千问Qwen3-Max-Thinking正式登场!高效推理新路径,实测能力抢先看
智东西1月27日报道,昨晚,阿里巴巴推出了Qwen3-Max-Thinking,这是阿里千问系列目前能力最强的旗舰级推理模型,在19项权威基准测试中,Qwen3-Max-Thinking跟GPT-5.2-T…

2026-01-27

OpenAI开启Codex发布月 多款新品助力AI编程革新 引领软件产业新潮流
作为OpenAI深耕智能编程领域的核心生态,Codex已从最初的API接口迭代为集模型、工具与工作流于一体的“AI软件工程师”,其演进速度与市场认可度持续攀升。 此次发布月的产品矩阵将围绕企业级需求与开发者…

2026-01-27

农业AI大模型领航:江苏叁拾叁打造智慧农业新基建,驱动产业新未来
江苏叁拾叁智慧农业有限公司通过其多年实践,给出了一个清晰的答案:以农业AI大模型为核心,构建贯通数据、知识、装备与服务的智能化基础设施,正在成为驱动农业现代化的“数字底座”。这一新基建以标准化、智能化和服务化…

2026-01-27