狂欢背后的冷思考：Open AI“网红化”搅动AI圈-科技前沿-媒体界

文 | 明晰野望，作者丨林森

Open AI作为AI时代的科技先锋，每一个动向都备受关注。但是吃多了“网红化”带来的流量红利，Open AI似乎很难像学者一样老实待在实验室了。

马斯克犀利批判，AGI团队负责人黯然离职，光环下的深度推理大模型性感却似乎遥不可及。

中国AI行业在ChatGPT的刺激下这两年集体追赶预训练大模型，对资源、数据、算力大笔投入。

面对Open AI抛出的新动作，从预训练模型到深度推理模型转技术路线，跟或不跟？选择发展应用还是死磕大模型技术？这些都成为全球AI圈新的选择题。

李开复揭秘o1模型上线幕后

Open AI越来越喜欢搞大新闻。

2024年9月，在ChatGPT4o模型推出没有几个月，Open AI就发布了号称“迄今为止功能最强大”的o1系列模型，其首席执行官‌山姆·奥特曼称这是“新范式的开始，人工智能可以进行复杂推理了”。

这就是所谓的“深度推理模型”。简单说，它最与众不同的是，回答之前会思考，产生一个很长的内部思维链，逐步推理，模仿人类思考复杂问题的过程。

o1模型是首个通过大规模强化学习算法训练的模型，其对“算法”和“算力”的要求，可能更甚于“数据”。

如果预训练模型是 “数据贪吃蛇”，那么深度推理更需要“算法大师”，并同样是“算力消耗大户”。

有人说，“以前的预训练大模型是学习数据，o1 更像在学习思维。”预训练模型是靠海量数据和算力堆砌的高级版信息搜索和提炼概括，推理则被认为是 AI实现人类或超人类水平智能的关键。o1模型似乎离真正的“人工智能”更近了一步。

Open AI犹如新的大杀器，搅乱全球大模型圈。

从 OpenAI 公布的评测结果来看，o1在 Codeforces 编程竞赛中超过了89%的参赛者，在美国数学奥林匹克竞赛的资格赛中名列全美前500名，在物理、生物和化学问题的基准测试中超越了人类博士水平的准确率。

之前Open AI 将 AGI（通用人工智能）划分了五个发展阶段，其中第一级「ChatBots」聊天机器人，典型的就是ChatGPT；第二级「Reasoners」推理者，解决博士水平基础问题的系统。o1模型发布代表Open AI在向外宣称，其实现了AI能力的跃迁，达到了人工智能发展阶段的第二级。

如果真是这样，这也将意味着Open AI再次大幅领先，把其他所有还在发展预训练模型，追赶ChatGPT路线的一众大模型厂家再次甩在身后。

目前o1仅有少数模型对高级别付费用户开放。但根据实测来看，o1的水准可能差强人意。

例如，o1在很多方面甚至不如 GPT-4o，仅支持文本，不能看，不能听，没有浏览网页或处理文件和图像的能力。还有内测的 AI 安全研究公司 Apollo Research 发现，o1 可能会假装遵循规则完成任务。数学家陶哲轩直言，“使用 o1 就像在指导一个水平一般但不算太没用的研究生。”

更有甚者，苹果日前放出了一篇论文，暗示了Open AI的o1模型不会推理，这篇论文论证了例如给小学数学题加句“废话”插入无关信息，就会干扰推理。

Open AI用o1模型“卷”同行，真的是技术能力的跃迁吗？

近期零一万物CEO李开复在一则公开对话里透露的“八卦”道出了内幕。

他直言，“我刚从硅谷回来，听说GPT5的训练不太顺利，因为10万张集群蛮难搞定的。但是Open AI又要融资，GPT5没有出来，没有一个由头让投资人投资，因为大家都在追赶，有些也快赶上了，所以他只有祭出了一个内部准备不发布的o1。”

不过李开复并没有过多评价o1模型，对Open AI的评价依然很高，他援引Open AI内部人士说法，Open AI还有很多“好东西”没有发布，很多已经做出来了。

Open AI原本定位是一家非营利组织，但它正在迅速转变为营利性公司。近期Open AI 以 1570 亿美元估值融资 66 亿美元，成为硅谷史上最大的一次融资。据《华尔街日报》报道，微软和OpenAI都聘请了投资银行，以咨询重组后的治理权和股权安排。

初心之变的背后，不仅有o1模型的仓促面世。今年以来，Open AI已经有十余位中高层领导先后出走。就11月9日，上任OpenAI研究与安全副总裁仅3个月后，OpenAI 安全系统团队负责人翁荔（Lilian Weng）宣布将离开O这家自己已经工作近 7 年的公司。

这些迹象都在表明，Open AI正在从“学者”变成了“网红”，似乎一刻也不想离开热搜。但如果企业一直没有实质性技术进展，人们的阈值将会不断改变。

大模型竞赛转向“务实化”

在大洋的另一边，中国大模型公司走出了另一条道路。

在追赶算力和数据方面，正如李开复所言，许多同行包括中国公司，已经追平ChatGPT4o。

例如，腾讯的混元大模型今年不断升级，根据官方资料，相比前代模型，最新的混元Turbo性能显著提升，训练效率提升108%，推理效率提升100%，推理成本降低 50%，效果在多个基准测试上对标GPT-4o，且第三方测评居国内第一。

李开复的零一万物也在10月份官宣，其新的预训练旗舰模型 “闪电”，在国际权威盲测榜单 LMSYS 上超越了 Open AI 。

预训练模型对大数据和算力投入要求极高，再加上新的o1模型面世，还是有人动摇了。近期业内关于“中国AI六小虎”（智谱AI、零一万物、月之暗面、百川智能、MiniMax、阶跃星辰）中有公司要放弃大模型的消息喧嚣尘上。

但是许多互联网头部公司仍在坚持投入大模型技术。根据最新财报，腾讯一个季度在研发上的投入就高达179亿元，阿里也高达142亿元。两家公司不约而同强调，要继续投入AI。

观察发现，中国大模型行业已经出现了两种发展路径——

第一种，例如腾讯、阿里、字节跳动、百度这样的互联网头部公司，仍在坚持预训练模型这一战略级技术路线，并持续投入，走出了“内部应用提效+外部行业输出”的务实路径。

在巨额投入后，技术快速成熟，这些大厂的大模型能力不仅追赶上ChatGPT，其大模型技术还在内部和各业务结合落地，带动业务新发展，例如百度的搜索、腾讯的广告和SaaS产品、阿里的电商等业务都已经受益于AI提效升级。阿里巴巴在最新财报表示，AI收入连续五季度增长。

同时，这些大厂把成熟的大模型算力和技术向行业输出，一方面实现新的商业化，另一方面助力各行业搭上AI的快车，带动整个中国人工智能的发展。今年中国快速出现大模型技术降价潮，不得不说正是头部大厂们通过资源投入快速带动了行业发展，是件好事。

第二种，中小型创业公司同样务实，聚焦发展各类AI应用创新。

以“大模型六小虎”为例，它们在今年前10个月的技术进展中，纷纷展示了各自在AI应用领域的成果。

月之暗面的Kimi探索版具备AI自主搜索能力，智谱AI的AutoGLM实时语音互动应用开始内测，百川智能推出首款AI助手“百小应”，MiniMax将发布端到端实时语音通话API产品……

这些应用不仅丰富了AI产品的形态，也为创业公司们带来了商业化的可能。