媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

出身商汤的曦望:押注推理GPU赛道 三年构建三代芯片矩阵谋突破

2026-01-23来源:快讯编辑:瑞雪

高性能GPU及多模态推理芯片领域迎来新势力——曦望Sunrise。这家脱胎于商汤科技大芯片部门的创新企业,自2024年底独立运营以来,正以差异化技术路线和豪华阵容引发行业关注。其核心团队由200余名专业人士组成,其中80%为技术研发人员,汇聚了来自AMD、华为海思、百度等科技巨头的精英,硕士及以上学历占比超八成,平均行业经验达15年。

公司管理层阵容堪称"全明星":董事长徐冰作为商汤科技联合创始人,曾主导完成超66亿美元融资并推动港交所上市,创下全球AI领域融资纪录;联席CEO王勇拥有20年芯片研发经验,曾担任AMD dGPU首席架构师,主导多款7nm芯片从设计到量产的全流程;另一位联席CEO王湛则是百度创始团队成员,在百度任职16年间担任资深副总裁,深度参与人工智能战略布局。这个兼具技术深度与商业视野的团队,正带领曦望在GPU赛道开辟新战场。

与传统GPU厂商"训推一体"的路径不同,曦望选择聚焦推理场景的"纯推理"路线。通过在调度机制、缓存架构、片上SRAM等核心环节进行原生优化,结合LPDDR内存技术,实现了单位Token推理成本的大幅降低。公司宣称,其技术方案可使推理成本下降90%,同时提供更稳定的服务质量。"我们要重写中国AI产业的成本结构,"王湛在接受采访时表示,"当推理算力变得像水电一样普惠,AGI的潜力才能真正释放。"

这种技术自信源于持续的研发投入和产品迭代。据披露,曦望已累计投入20亿元研发资金,构建起三代芯片产品矩阵:2020年量产的S1芯片作为国内首款视觉推理芯片,已适配超千种计算机视觉模型,获得索尼、小米等头部企业IP授权;2024年推出的S2芯片实现对主流GPU生态的兼容,支持DeepSeek、Qwen等主流大模型运行;计划2026年发布的S3芯片更将目标设定为"推理性价比之王",通过FP8/FP4低精度推理技术,力争实现"百万Token一分钱"的行业新基准,在能耗和成本上形成数量级优势。

在生态建设方面,曦望展现出开放姿态。S2芯片通过兼容CUDA生态,降低了开发者迁移成本,同时针对国产大模型进行深度优化。这种"双轨并行"的策略,既保证了技术兼容性,又为本土AI应用提供了定制化解决方案。随着所筹资金逐步投入下一代GPU研发和规模化量产,这家成立仅数年的企业,正在重塑高性能计算领域的竞争格局。

太空算力崛起:光伏能源成核心,HJT技术或引领太空算力能源新变革
轨道资源方面,LEO 低地球轨道性价比最优,SSO太阳同步轨道因日照时长优势成为算力中心首选,剩余可用空间宝贵,推动算力平台向大型母舰与多星集群两端演进。 投资建议上,重点推荐具备海外客户基础的HJT 整…

2026-01-23

伺服粉末压机谁领风骚?2026十大厂商技术大比拼,新能源与3C应用案例解析
前者在伺服系统的响应速度和稳定性方面具有优势;后者则致力于将数字孪生技术应用于粉末压机,实现了工艺参数的虚拟调试与优化。 某领先的3C电子制造商曾面临微型电感生产过程中良率不稳定的难题,通过引入高精度伺服粉…

2026-01-23

百度文心Moment大会启幕 文心5.0正式版上线引领AI应用新突破
矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模型;专精模型面向行业应用和垂直场景,包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型。 基于强大的原生全模…

2026-01-23