媒体界
行业纵横 资讯速递 科技前沿 企业动态 峰会论坛

中美顶尖LLM差距仅5个月?凯富·李这样说!

2024-10-17来源:ITBEAR编辑:瑞雪

近日,有传言称中国六大主流大型语言模型公司中有数家已放弃预训练。对此,零一无限创始人李凯夫于周三明确反驳,表示零一无限从未且永远不会放弃预训练,并强调其预训练既快速又出色。

李凯夫在新旗舰预训练模型“Yi-Lightning”(闪电模型)发布会上发表上述言论。他指出,Yi-Lightning是一款“高性价比的顶级模型”,在推理速度和价格上具有显著优势。该模型的最高生成速度提升了近40%,每百万标记的成本仅为0.99元,且在此定价下仍能实现盈利。

李凯夫表示:“这是中国首个在国际权威榜单上排名极高、超越多数美国主流模型、并首超全球领先的OpenAI GPT-4o的模型。Yi-Lightning闪电模型不仅具备世界级模型性能和极快的推理速度,而且价格极低,非常适合应用调用和企业应用场景。”

在会后讨论中,李凯夫回应了关于中国预训练是否落后于美国的问题。他坦言中国确实存在差距,但强调某些观点夸大了这一差距,认为中国落后十年甚至更久。他提到,通过精确计算,今年五月由GPT-4o开发的模型已被零一无限超越。“如果真的要计算中国超越美国还需要多久,至少零一无限的01.AI模型仅比OpenAI的模型落后五个月。”

01.AI成立于2023年5月16日,致力于创建一个新的AI 2.0平台和面向全球的AI优先生产力应用公司。其核心团队成员来自谷歌、微软、IBM和百度等知名企业。

在融资方面,01.AI已完成三轮融资,其中包括由阿里巴巴领投的2.5亿美元(约18.08亿元人民币)的Pre-A轮融资,估值超过10亿美元,成为一家独角兽企业。

在产品与商业化方面,01.AI专注于海外To C(消费者级)付费市场和国内To B(企业级)付费市场。针对B端和C端的布局,李凯夫表示,大型模型公司同时涉足To B和To C领域颇具挑战,需要多样化的管理策略,因为两队团队在基因、运营方式和KPI考核等方面存在差异。

李凯夫进一步解释说,在To C领域,公司主要瞄准海外市场,因为国内To C产品的流量成本是一个重大问题,在当前充满挑战的环境中需要谨慎判断。他提到:“对于To C,我们主要关注海外市场,原因有几个:当我们开始零一无限的工作时,国内没有合适的中文模型,所以我们不得不先在海外尝试。一段时间后,我们获得了经验,并迭代了一、二、三款产品。其中一些产品表现非常好,而其他产品则不那么成功,我们也在不断调整。同时,我们也在观察何时适合在国内推出某些产品。国内To C产品的流量成本正在上升,我们注意到一些竞争对手的用户获取成本从十几元上涨到三十多元,最近用户流失也相当严重。在这样充满挑战的环境中,我们会非常谨慎,目前不会在中国推出新的To C应用。我们将继续维护现有产品,但更多精力将放在以较低成本在海外获取高质量用户,或直接销售应用并通过订阅收费。海外的订阅习惯相对成熟。这些是主要原因。目前,海外To C产品能让我们平衡盈利能力和用户增长成本。我们将关注国内机会,待时机成熟再行动。”

目前,零一无限再次选择优化预训练模型,并在发布会上首次展示了其新ToB战略下的首个行业应用产品——AI 2.0数字人,专注于国内零售和电商To B业务场景。

李凯夫表示:“生成响应依赖于我们的Yi-Lightning大型模型,某家酒店和旅游公司的GMV销售额因此飙升了170%。我认为,对于大型模型公司而言,最好的方法不是销售模型或使用模型进行客户服务应用,而是理解用户的完整需求,并创建一个端到端的综合解决方案。这样,购买大型模型和数字人的公司每次使用时都能立即看到利润,用得越多赚得越多,从而增加他们向我们付费的意愿。”

关于成本问题,李凯夫透露,零一无限的预训练使用了2000个GPU,耗时一个半月,成本超过三百万美元,但这仅是Grok成本的1%-2%。