OpenAI近期因战略调整引发广泛关注,其联合创始人兼总裁Greg Brockman在最新播客中透露,公司放弃视频生成项目Sora并非收缩,而是为全力推进“超级应用”(Super App)及新一代模型“Spud”的研发。这一决策背后,折射出OpenAI对技术落地路径的深度思考。
Greg将OpenAI的技术路线比作迪士尼的生态布局:以核心模型为“米老鼠”,衍生出视频、企业服务等多元化应用。但当前算力资源有限,难以同时支撑视频生成与文本推理两大技术分支。他直言:“Sora的研究仍在继续,但将聚焦于机器人领域,而非短期内面向知识工作者大规模落地。”这一选择源于对AGI(通用人工智能)路径的坚定信念——文本推理模型已被验证为更接近AGI的技术方向,近期一位物理学家借助OpenAI模型在12小时内解决长期难题的案例,进一步强化了这一判断。
即将推出的“超级应用”被描述为“个人助理的终极形态”。Greg透露,该应用将整合编程、浏览器与ChatGPT功能,成为用户接触AGI能力的核心入口。它不仅能编写代码、管理日程,更通过深度连接邮件、日历等工具,形成个性化记忆系统。例如,用户可直接下达“帮我规划产品发布会”的指令,应用将自动协调各方资源并生成方案。目前,OpenAI已从内部知识工作者的自发使用中验证了这一框架的可行性,未来几个月将逐步向公众开放。
针对竞争对手Anthropic的挑战,Greg承认对方在编程辅助功能上进展迅速,但强调OpenAI通过构建真实代码库训练环境,已显著提升模型处理杂乱代码的能力。“当用户比较实际使用效果时,往往会选择我们。”他透露,公司正通过组建专门团队,持续优化模型在真实软件工程场景中的表现。
新一代模型“Spud”的研发则代表OpenAI对预训练技术的突破。Greg将其描述为“过去两年研究成果的集大成者”,重点提升复杂问题解决能力与上下文理解精度。他举例称,新模型将减少用户重复解释需求,既能处理开放性问题,也能优化基础交互体验。“这种改变如同朋友从‘需要你反复解释’变为‘心有灵犀’。”
在技术伦理层面,Greg承认AGI发展伴随风险,但强调OpenAI通过“提示词注入攻击防护”等机制确保模型安全性。他类比人类易受欺骗的特性,指出AI安全需要社会基础设施的协同建设:“就像电力系统需要安全标准,AI也需要开放对话与监管框架。”对于AGI实现时间表,他个人认为已完成70%-80%,未来几年内模型将具备完成绝大多数智力任务的能力。
商业布局方面,OpenAI今年完成的1100亿美元融资将主要用于算力扩张。Greg将算力视为“收入引擎”而非成本中心,指出企业市场对知识工作工具的支付意愿远超预期。他预测,随着AI渗透至个人生活与商业场景,收入结构将逐渐模糊化:“就像笔记本电脑既是工作工具也是娱乐设备,未来的AI应用将覆盖所有数字需求。”
面对公众对AI的担忧,Greg呼吁人们亲自体验技术价值。他提及用户借助ChatGPT诊断儿童脑瘤的案例,强调AI正在创造“难以量化的社会收益”。对于数据中心的能耗争议,他解释称实际水资源消耗极低,且部分项目通过升级电网降低了居民电费:“技术的影响取决于我们如何使用它,而不是技术本身。”
