媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

智谱GLM-5或为海外神秘大模型 复用DS架构 股价飙升市值达1500亿港币

2026-02-11来源:互联网编辑:瑞雪

春节期间,国产人工智能领域迎来一波新品发布热潮,其中智谱科技推出的新一代大模型GLM-5成为行业焦点。这款模型不仅与备受瞩目的DeepSeek V4同期亮相,更凭借技术突破引发资本市场强烈反应——公司股价在短期内实现三倍增长,总市值突破1500亿港币大关。

全球模型服务平台OpenRouter此前上线的一款代号"Pony Alpha"的匿名模型,因在代码生成任务中展现出与Claude Opus相当的实力而引发技术圈热议。经过多方验证,该模型的真实身份逐渐浮出水面:系统提示词中自述为GLM架构,且存在与GLM家族模型相同的文本处理漏洞——当输入"锅内倒入植物油烧热"这类中文烹饪指令时,模型会输出混乱结果。这些特征与智谱即将发布的GLM-5高度吻合。

技术解析显示,GLM-5采用与DeepSeek-V3/V3.2相同的稀疏注意力机制(DSA),总参数量达7450亿,是前代GLM-4.7的两倍规模。其创新性的多token预测架构包含78层隐藏层,通过256个专家模块实现动态计算,每次激活8个专家模块即可输出约440亿参数的推理结果,稀疏度控制在5.9%水平。这种设计使模型在保持高效运算的同时,上下文处理能力扩展至202K token。

值得关注的是,GLM-5在技术复用方面取得突破。通过兼容DeepSeek的稀疏架构,新模型可直接调用vLLM、SGLang等主流推理框架的优化方案,显著降低企业级部署的技术门槛。这种技术协同效应被视为推动智谱股价飙升的关键因素之一——资本市场预期该模型将加速在金融、医疗等领域的商业化落地。

尽管GLM-5在文本处理领域展现强劲实力,但其多模态能力仍存提升空间。作为DeepSeek技术路线的延续者,该模型现阶段主要聚焦文本生成,与当前主流大模型普遍具备的视频处理能力形成对比。业内人士指出,随着2026年多模态技术成为行业标配,GLM系列模型可能需要通过架构升级来弥补这一短板。

资本市场对GLM-5的热烈反响已转化为实际数据:智谱科技股价较数月前IPO时暴涨200%,总市值突破1500亿港币。这种增长态势既反映投资者对国产大模型技术突破的认可,也预示着AI领域新一轮竞争格局正在形成。随着GLM-5在全球市场的持续渗透,中国人工智能企业的技术影响力正在从亚太地区向全球范围扩展。

阿里达摩院发布RynnBrain模型:机器人具备时空记忆,具身智能迈关键一步
凤凰网科技讯 2月10日,阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并一次性开源了包括30B MoE在内的7个全系列模型。该模型首次为机器人引入时空记忆与物理空间推理能力,使其能够在执行任务过…

2026-02-11

阿里千问Qwen-Image-2.0来袭:文字渲染精准,真实质感细腻,编辑生图二合一
这是一幅中国风手绘风格的杭州两日禅意人文之旅行程导览双语海报,整体采用淡雅米黄色仿古宣纸背景,四角饰有传统回纹边框;画面中央以一条飘逸的云纹卷轴丝带贯穿连接两天行程,上方大标题为“杭州· 两日禅意人文之…

2026-02-11

百度深夜“不熄灯”:“O计划”底层架构重组,AI化升级引领行业新跨越
不跟风营销、不浮躁造势,而是把资源和精力投在最核心的技术创新上,这正是大厂该有的战略定力。 百度在AI领域的布局一直非常靠前,这一次同样不例外。百度这一次用行动证明,真正的大厂竞争力,从来不在营销声势里,而在…

2026-02-11

字节Seedance 2.0开启内测,多举措限制真人素材防AI技术滥用
北京航空航天大学人工智能研究院教授沙磊评价称,现在Seedance 2.0还在小范围内测阶段,字节也限制了一部分模型功能,比如只有在进行活体认证的情况下可以生成真人视频,不支持输入真人图片或视频做主体参考…

2026-02-11