媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

AI领域竞争白热化,谁将率先跳出同质化包围圈?

2024-12-25来源:钛媒体APP编辑:瑞雪

随着2024年步入尾声,国内AI大模型领域迎来了一波新的发展高潮。多家大模型厂商似乎都在为年终业绩冲刺,好消息接踵而至。

先是智谱,作为业界知名的“大模型六小虎”之一,成功完成了高达30亿元的新一轮融资。紧接着,字节跳动推出了豆包视觉理解模型,而快手也紧随其后,正式上线了可灵1.6版本。这一系列动作无疑为整个行业注入了新的活力。

如果说2023年标志着大模型技术的元年,那么2024年则可以被视为AI技术的应用之年。这一年里,深度推理技术逐渐成为主流,AI Agent成为新的风口,多模态模型也竞相涌现。AI产品的迭代速度之快,让人不禁感叹技术发展的日新月异。然而,从AI技术的爆发至今,其实还不到两年的时间。

在这短短的时间里,AI技术仿佛经历了十年的变革。但尽管如此,这一被视为互联网级变革的产品,却至今仍未迎来真正的爆发时刻。

过去,算力被视为大模型发展的关键要素。在百模大战如火如荼的那一年,许多厂商都试图通过增加参数来迅速占领市场份额。然而,从今年开始,这种策略似乎已经不再奏效。随着行业的快速迭代,仅靠算力和参数规模的提升已经难以真正超越同行。再加上大模型的训练和运营需要大量的算力和资金投入,这对现阶段还难以找到成熟商业模式的厂商来说,无疑是一个巨大的挑战。

以字节跳动为例,据报道,仅在2024年,该公司在AI领域的投入就达到了惊人的800亿元,几乎相当于BAT三家公司资本开支的总和。而到了2025年,这一数字还将进一步攀升至1600亿元,其中约900亿元将用于AI算力的采购。即使如此,算力仍然是一个巨大的瓶颈。微软为了支持ChatGPT和新版必应的算力需求,甚至不惜耗费几亿美元和上万张英伟达A100芯片来打造超算平台。

然而,从长远来看,算力并不能构成真正的护城河。它更多地体现为硬件层面的核心竞争力。真正决定模型表现的是算力和训练语料的质量,而这两者都取决于经济实力。因此,即使谷歌和OpenAI这样的巨头也难以保持技术优势。

目前国内大模型的现状是,各公司的模型能力参差不齐,但核心功能普遍同质化严重。一个新功能推出后,很快就会被其他厂商赶上。例如,Kimi最初靠长文本成功进入了国内AI大模型的第一梯队,但现在长文本已经成为大多数AI搜索产品的基本能力。

随着竞争的加剧,AI领域的关键词开始从“模型层”转向“应用层”。下半年以来,越来越多的厂商开始关注AI技术的实际应用场景。然而,同质化的问题在应用层也同样存在。例如,豆包视觉理解模型发布后,很快就遭遇了Kimi视觉思考版的竞争。

在这种情况下,如何找到破圈点成为了AI厂商们共同面临的难题。一些业内人士指出,未来能否出现杀手级别的应用,将是决定各家胜负的关键。然而,至少到目前为止,我们还看不到这样的火花。尽管AIGC技术在某些领域取得了进展,但整体上仍处于发展阶段,生成内容的质量、稳定性和可控性等方面仍存在不足。

在硬件端,AI手机也成为了新的竞争焦点。几乎所有头部手机厂商都在对语音交互进行升级,试图将之前的语音助手打造成更智能的AI Agent。然而,这种升级更多地只是停留在噱头上,真正的AI体验并没有太大的变化。

商业化方面,AI应用之所以受到如此重视,一个重要原因是市场亟需看到AI技术能转化为可落地的商业模式。然而,这并不容易。付费订阅和广告是目前AI搜索类产品能触及的主要盈利模式,但前者在国内市场一直难以走通,后者则可能损害用户体验。

以豆包为例,尽管其用户规模在过去几个月有所增长,但在使用时长、打开频次及商业化潜力上仍不够理想。字节管理层判断AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式可能需要更视觉化的用户体验和更低的用户使用门槛。因此,字节已经提升了即梦的产品优先级,尝试用新的路径打造AI时代的“抖音”。

尽管如此,AI对话类产品作为生成式大模型在C端落地后最拿得出手的产品,其更大的作用仍然是样本收集场景,而不是赚钱的场景。只要有活跃的用户和可持续的使用价值,AI对话类产品的重要性就仍然存在。

回顾上一代移动互联网级别的创新,从APP Store的推出到智能手机规模化应用的爆发,走了五年的时间。而如今AI技术只用了不到两年的时间,就已经让我们看到了质的飞跃。或许在不久的将来,我们就能见证下一个iPhone时代拐点的到来。