在商业格局加速演变的当下,一场聚焦科技与商业前沿的盛会——36氪WISE2025商业之王大会于北京798艺术区传导空间举行。此次大会以“风景这边独好”为主题,在充满不确定性的商业环境中,探寻中国商业确定性的发展路径,吸引了众多行业目光。
与传统的行业峰会不同,今年的WISE大会别出心裁,以“科技爽文短剧”的形式打造了一场沉浸式体验。从AI对硬件边界的重塑,到具身智能开启真实世界新入口;从品牌在出海浪潮中实现全球化,到传统行业借助科技完成升级,大会呈现的不仅是行业趋势,更是在无数商业实践中沉淀的宝贵经验。
在大会上,后摩智能创始人兼CEO吴强分享了关于端边AI计算的深刻见解。他指出,大模型推动AI进入2.0时代,不仅改变了云端数据中心的计算格局,也让端边侧迎来巨大发展机遇。由于端边设备对实时性和隐私性的天然需求,以及AI普惠化的发展趋势,端边AI计算有望成为AI竞争的主战场。
目前,端边计算市场规模虽处于起步阶段,但未来潜力巨大。行业分析机构STL Partners预测,未来五到十年,端边计算市场规模可能达到四千亿美元甚至更高。当下端边计算以逻辑控制为主,不过未来五到十年,格局将发生重大转变,从逻辑控制为主逐步转向以数据为中心的AI计算为主。回顾数据中心过去十年的发展,计算范式由应用场景演变驱动,从逻辑控制类计算为主转变为AI计算为主,端边侧也有望出现类似变化。未来,端边任务将更多转向感知、理解、决策等,以数据和AI为主导。
端边AI计算可分为垂类和通用两大类。垂类场景如手机、智能驾驶等,因场景明确、体量大,已受广泛关注并做了大量软硬件协同优化。而端边通用AI计算覆盖众多不同场景,每个场景规模虽不大,但总和可观。这类计算需求多样,既要保证效率又要兼顾通用性,目前才刚开始受到重视。
端边通用AI芯片处于端边侧,面临成本敏感、功耗敏感、带宽易成瓶颈等问题,尤其在大模型时代更为突出。同时,作为通用芯片,它要适配众多场景,需在不损失通用性的前提下提升能效。传统架构虽灵活性好,但如今遇到“存储墙”和“功耗墙”瓶颈,数据搬运成为主要阻碍,90%的功耗可能都耗费在数据搬运上。因此,突破这两大瓶颈成为提升端边通用AI效率的关键。
存算一体被认为是突破存储墙和功耗墙的有效路径之一。它通过拉近数据与计算的距离,减少数据搬运,从而提升能效。存算一体有多种实现方式,基于SRAM适合提升计算密度和能效,基于DRAM更擅长解决带宽问题。后摩智能自成立起就专注于存算一体的大算力芯片研发,是首家将存算一体大算力从论文推向实践的企业,已推出两代量产产品。
今年7月,后摩智能发布旗舰芯片M50,这是首款专为端边大模型设计的芯片。它提供约100 - 160T算力,功耗仅10W,能支持从140亿到1200亿参数的大模型。产品形态多样,如M.2卡和Duo M.2卡,最小的M.2卡仅口香糖大小,却可运行140亿甚至300亿参数的模型,给端边场景客户带来惊喜。
发布以来,后摩智能积极推动M50落地。端侧合作场景包括智能语音设备、AIPC、陪伴机器人、AI NAS等;边侧主要聚焦AI网关、5G + AI、计算盒子等。针对M50,后摩智能提供完整工具链,支持各类已训练好的模型直接转换到硬件运行,无需重新训练,且支持bFP等浮点精度,编译过程顺畅,客户可快速完成模型适配。
从7月至今,后摩智能与芯片上下游伙伴紧密合作,完成了与多种操作系统(包括Windows、Linux,以及麒麟、统信等信创系统)的适配,也协同了各类主控芯片(x86、ARM及国产CPU)。同时,正与算法层、解决方案层伙伴开展大量适配工作,预计明年初将有更多落地应用推出,致力于与更多伙伴共建端边AI生态。