阿里发布Qwen3-Max-Thinking：超万亿参数刷新纪录，推理性能与Agent能力双飞跃-峰会论坛-媒体界

阿里云正式推出其迄今为止规模最大、性能最强的千问系列推理模型——Qwen3-Max-Thinking。该模型总参数量突破万亿级，预训练数据规模达36T Tokens，在多项核心指标上实现全球领先，标志着国产大模型技术迈入新阶段。

在性能突破方面，Qwen3-Max-Thinking通过参数规模扩展与强化学习优化，在19项国际权威基准测试中刷新纪录。该模型不仅在数学推理领域斩获AIME 25和HMMT 25国内首个双满分，更在复杂推理、指令遵循、人类偏好对齐等维度达到国际顶尖水平。特别是在启用工具的"人类最后测试"（HLE）中，以58.3分超越GPT-5.2-Thinking（45.5分）和Gemini 3 Pro（45.8分），创下当前所有模型最高分。

技术架构创新方面，模型引入全新测试时扩展机制，通过"经验提炼-自我迭代"的推理范式，显著提升计算效率。传统推理路径常出现重复推导现象，而新机制可对历史推理结果进行结构化提炼，在相同上下文窗口内实现多轮智能迭代。这种突破使模型在保持高性能的同时，推理成本降低30%以上，为大规模商业化应用奠定基础。

针对智能体（Agent）应用场景，模型特别强化了原生工具调用能力。在QwenChat交互界面中，用户可直观体验模型自主选择搜索、个性化记忆、代码解释器等核心工具的能力。通过规则奖励与模型奖励联合训练体系，模型能根据任务需求智能组合工具使用策略，回答准确率提升40%，幻觉问题减少25%，在专业领域表现接近人类专家水平。

开发者可通过QwenChat平台免费体验模型能力，企业用户可登陆阿里云百炼平台获取API服务。千问官方APP即将完成模型接入升级，届时所有用户均可通过PC端、网页端及移动端免费使用。目前平台已开放数学推理、代码生成、多轮对话等场景的测试接口，支持中文、英文等多语言交互。

阿里千问旗舰推理模型Qwen3-Max-Thinking发布，吴嘉畅谈AI未来新方向

业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论很常见，冗余推理效率低下；而千问采用的这一机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效…

2026-01-27

阿里发布Qwen3-Max-Thinking模型：超万亿参数，太空部署与开源成绩亮眼

目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。此前，预览版Qwen3-Max-T…

2026-01-27

感知奠基，认知跃迁：江苏叁拾叁解锁智慧农业AI大模型进阶密码

早期阶段聚焦于“感知”，即如何更全面、精准地获取农业环境与作物状态数据；而当前的前沿探索，则指向更高维度的“认知”，即如何让机器系统理解数据背后的意义，形成对农业生产系统的深刻洞察与推理能力。同样，在水产养殖…

2026-01-27

微博×益普索：2026冬奥热点趋势洞察，社交互动与消费新机遇并存

2026年米兰科尔蒂纳冬奥会开幕在即，微博与益普索联合发布的《2026冬奥热点趋势洞察白皮书》上篇，基于社交大数据与消费者调研，揭示了冬奥相关的社交热点趋势与消费机遇。调研显示，60.1%的用户会通过社交…

2026-01-27

阿里云火花大会聚焦AI教育，一触即改携千问共筑教育普惠新未来

一触即改以“技术普惠”为核心理念，基于阿里云千问生态，通过模型轻量化、场景垂直化等技术优化，打造低成本、高易用的AI教育平台工具，覆盖学术辅助、语言学习、内容创作等场景，打造高效的AI教育工具，助力缩小教育资…

2026-01-27

A股三大指数集体收涨存储芯片领涨 19位基金经理任职变动引关注

2026-01-27

易方达黄金主题LOF暂停申购国投瑞银白银期货LOF提示溢价风险

2026-01-27

新三板长宇股份现大宗交易每股2.56元成交72万股折价近三成

2026-01-27

午后A股强势回暖！芯片巨头投资加码，商业航天大飞机板块集体上扬

2026-01-27

郑中设计2025年净利润预增超三成，95后实控人之女郑一茜履新副董事长

2026-01-27