媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

阿里云发布通义千问2.5,性能全面赶超GPT-4 Turbo

2024-05-09来源:互联网编辑:瑞雪

本报讯(记者 张伟)5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在

多个基准测评收获最佳成绩,超越meta的Llama-3-70B,成为开源领域最强大模型。

相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。

通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。

通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

AI翻译耳机大比拼!科大讯飞Pro 3等四款热门产品,哪款能成你的跨语言沟通神器?
今天,我们将对比几款市场上备受关注的AI翻译耳机,包括科大讯飞(iFLYTEK)AI会议降噪无线翻译耳机Pro3、索尼WF-1000XM4、苹果AirPods Pro以及三星Galaxy Buds Pro,…

2026-01-15

苏州大学团队突破关键难题!新型柔性太阳能电池助力航天能源保障
【太平洋科技】1 月 14 日消息,据央视新闻报道,近日,苏州大学张晓宏教授团队成功研发出新型柔性晶硅钙钛矿叠层太阳能电池,该成果已发表于国际顶级学术期刊《自然》。这项研究攻克了长期以来困扰叠层柔性电池在…

2026-01-15

光伏并网安全防线:专用断路器如何成为关键守护者?
3.复杂的故障电流:光伏系统输出的电流受光照强度影响,且在发生故障时,其提供的故障电流特性可能与电网侧不同,这对断路器的分断能力、检测灵敏度提出了特殊要求。 *安全隔离:在系统需要检修、维护或出现紧急情况时…

2026-01-15

储殷:“死了么”APP走红,彰显中国互联网经济需求旺活力足
盘古智库研究员、凤凰“K说联盟”成员储殷在谈及这一现象时表示,这款 APP的走红并非偶然,其背后折射出中国互联网经济独有的场景优势与旺盛活力,印证了 “中国这边风景独好” 的市场底气。 储殷直言,“死了么”…

2026-01-14