媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

谷歌Gemini 3震撼登场:性能全面领先 引领AI领域双雄争霸新篇章

2025-11-20来源:快讯编辑:瑞雪

Alphabet旗下谷歌公司近日正式发布其最新人工智能模型Gemini 3,这款被业界称为“全球最强多模态理解模型”的产品,以1501分的成绩刷新LMArena排行榜纪录,标志着人工智能领域进入谷歌与OpenAI双雄竞争的新阶段。发布当日,Gemini 3即被整合至谷歌搜索、Gemini应用等核心产品,展现出谷歌在AI商业化落地上的激进策略。

在性能测试中,Gemini 3展现出全方位优势。基础版本在GPQA Diamond研究生级推理测试中取得91.9%的准确率,Humanity’s Last Exam多步逻辑推理测试中以37.5%的无工具得分超越GPT-5 Pro此前纪录,SimpleQA Verified事实准确性测试更以72.1%的分数领先行业。其多模态处理能力尤为突出,MMMU-Pro测试得分81%,Video-MMMU测试达87.6%,可无缝处理文本、图像、视频、音频及代码五种信息模态。

配套推出的Deep Think增强推理模式成为技术突破点。通过“思维签名”和“思考等级”技术,该模式将思维链转化为可量产的产品,在Humanity’s Last Exam测试中得分提升至41.0%,GPQA Diamond测试准确率高达93.8%,ARC-AGI-2测试更创下45.1%的纪录。代码生成领域同样表现亮眼,Gemini 3以1487分登顶WebDev Arena排行榜,Terminal-Bench 2.0测试得分54.2%,SWE-bench Verified基准测试达76.2%,被谷歌称为“迄今最优秀的智能体编码模型”。其配备的100万token上下文窗口,可轻松应对长文本处理和复杂任务拆解。

产品落地策略上,谷歌打破传统发布周期,在Gemini 3发布当日即完成核心产品整合。谷歌搜索AI Mode引入沉浸式视觉布局和交互式工具,提供全新生成式用户界面;Gemini应用6.5亿月活跃用户可直接体验新模型能力,AI Overviews的20亿月活用户同步享受升级服务。开发者生态方面,模型通过Google AI Studio、Vertex AI等官方平台及Cursor、GitHub等第三方工具开放访问,全新推出的Google Antigravity开发平台更将AI辅助升级为协同合作伙伴,支持智能体在编辑器、终端和浏览器间无缝协作。

安全评估方面,Gemini 3成为谷歌史上最严格的审查对象,在抵御提示注入攻击和网络滥用方面表现优异。目前该模型已向部分订阅用户开放,Google AI Ultra订阅用户将在未来几周率先体验Deep Think模式,后续逐步扩大开放范围。这场AI竞赛中,OpenAI凭借ChatGPT周活突破7亿占据用户优势,而谷歌则依托Gemini应用6.5亿月活和AI Overviews 20亿月活的基础,通过新模型快速完成产品升级,形成双雄对峙的竞争格局。

神龙拜耳光伏支架:可调节设计,灵活适配多场景提升发电效率
神龙拜耳光伏支架的可调节功能,为用户提供了灵活调整角度的便利,能够根据太阳位置变化优化光照接收效率。这种设计不仅提升了光伏系统的发电性能,还增强了设备对不同安装环境的适应性。 可调节支架通过机械结构实现角…

2025-11-20

百度Q3财报:首次披露AI业务收入超百亿 加速AI计算投资布局未来
《科创板日报》11月19日讯(记者 黄心怡)18日晚间,百度发布2025年第三季度财报,显示季度总营收312亿元,同比下降7%;归属百度的净利润为亏损112.32亿元,主要受162亿元长期资产减值影响,上年同…

2025-11-20

科创人工智能ETF华宝(589520)开盘微跌,重仓股涨跌互现澜起科技等领跌
来源:新浪基金∞工作室 11月19日,科创人工智能ETF华宝(589520)开盘跌0.18%,报0.569元。科创人工智能ETF华宝(589520)重仓股方面,澜起科技开盘跌0.66%,芯原股份跌0.62%,…

2025-11-20

科创50增强ETF南方(588370)11月19日收跌 规模份额年内双降
规模方面,截止11月18日,科创50增强ETF南方(588370)最新份额为7577.20万份,最新规模为1.07亿元。回顾2024年12月31日,科创50增强ETF南方(588370)份额为1.63亿份,…

2025-11-20