媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Gemini 3正式登场:多模态推理霸榜,AI新格局或将重塑

2025-12-03来源:快讯编辑:瑞雪

谷歌最新发布的Gemini 3智能模型引发全球科技界震动。这款被定义为"通往AGI重要一步"的模型,在发布前就因开发者负责人一条仅含"Gemini"的推文引爆社交媒体,甚至导致推特平台多次出现访问故障。尽管Cloudflare事后澄清故障原因,但网友仍戏称这是"史上最成功的模型预热"。

在基准测试中,Gemini 3 Pro以1501分的Elo评分登顶LMArena排行榜,在Humanity's Last Exam(37.5%)和GPQA Diamond(91.9%)等核心指标上全面超越前代及Claude、GPT等竞品。数学能力方面,该模型在MathArena Apex取得23.4%的突破性成绩,重新定义了前沿模型的标准。多模态处理能力同样惊艳,在解析科学图表和视频流的任务中分别获得81%和87.6%的高分,事实准确性指标SimpleQA Verified更达到72.1%。

深度思考模式(Deep Think)的推出成为最大亮点。测试数据显示,该模式在Humanity's Last Exam(41.0%)和GPQA Diamond(93.8%)的表现优于基础版,在代码执行测试ARC-AGI-2中取得45.1%的得分。这种能力提升使模型能自主规划复杂任务,例如在模拟售货机经营测试中,通过长周期管理实现更高投资回报,全程保持决策连贯性。

开发者生态迎来重大革新。新推出的Google Antigravity平台将智能体开发提升至新维度,开发者可授权AI自主操作编辑器、终端和浏览器。该平台整合了Gemini 2.5 Computer Use浏览器控制模型和Nano Banana图像编辑模型,形成完整的开发工具链。在WebDev Arena测试中,Gemini 3以1487分领跑,Terminal-Bench 2.0测试取得54.2%的成绩,编码代理性能测试SWE-bench Verified得分达76.2%。

实际应用场景展现惊人潜力。用户上传匹克球比赛视频后,模型能分析技术缺陷并制定训练计划;学习复杂科学概念时,可生成交互式记忆卡片和可视化代码;烹饪爱好者能通过翻译手写食谱,生成多语言数字版本。搜索中的AI模式引入沉浸式视觉布局,用户查询RNA聚合酶工作原理时,系统会即时生成动态模拟界面。

定价策略采用分级模式,200k tokens以下任务输入/输出价格为每百万token 2美元/12美元,超过部分则升至4美元/18美元。深度思考模式将作为Google AI Ultra订阅专属功能,预计未来几周内上线。技术细节显示,这个基于MoE架构的模型使用TPU从头训练,具备1M输入和64k token输出能力。

市场反应印证行业期待。在X平台发起的"2026年最佳大模型"投票中,Gemini系列获得压倒性支持。官方数据显示,AI Overviews月活用户达20亿,Gemini应用突破6.5亿月活,云客户中超70%使用其生成式模型,开发者数量突破1300万。这场始于Bard仓促发布的转型,经过合并DeepMind、召回创始人等重大调整,正显现出战略成效。

马斯克再赞微信:集多功能于一体,国外难寻同类“生活神器”
马斯克在采访中表示:“在中国你可以只用微信生活,一个软件能聊天付款,在中国以外不存在这样的软件。” 对于微信的夸赞,马斯克已经不止一次。它有点像推特加贝宝(Paypal),再加一大堆其他东西,这些产品融为一…

2025-12-03

掌握TikTok流量密码:从逻辑到实操,解锁自然涨观看的稳定方法
TikTok 的本质是“情绪平台”,能让用户有情绪起伏的视频,平台一定愿意推。当算法清晰地识别出你内容的风格后,就会将你的视频推给更精准的人群,让自然流量越来越稳,而这就是自然涨播放的关键。 能涨自然观看…

2025-12-03

江苏工业互联网平台:以技术生态双驱动 开启智能制造新篇章
未来,江苏省工业互联网平台需要进一步加强数据安全管理,采用先进的加密技术和安全防护措施,确保企业数据的安全可靠。 江苏省工业互联网平台在推动智能制造方面展现了强大的潜力和广阔的前景。通过技术创新和生态合作,江…

2025-12-03

马斯克欲将X打造成多功能“超级应用” 借鉴微信模式拓展服务版图
据Economic Times报道,在和Zerodha联合创始人尼基尔·卡马斯(NikhilKamath)的对话中,特斯拉首席执行官埃隆·马斯克(Elon Musk)再次明确表示,想要把社交平台X打造成中国…

2025-12-03