媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

谷歌AI掌舵人点赞!清华姚班校友新研究突破,现双双入职Meta

2025-11-21来源:快讯编辑:瑞雪

谷歌AI掌门人Jeff Dean近日点赞了一项突破性研究,这项由清华姚班校友钟沛林团队主导的嵌套学习(Nested Learning,简称NL)范式,为解决大语言模型长期存在的灾难性遗忘问题提供了新思路。研究团队提出的Hope模型在语言建模与长上下文任务中展现出显著优势,相关论文已被NeurIPS 2025接收。

传统深度学习模型采用扁平化参数更新模式,通过堆叠网络层数或扩大模型规模提升性能,但这种"暴力堆参"的方式已逐渐触及瓶颈。研究指出,当前主流的Transformer架构本质上是NL范式的简化版本,其线性层结构未能充分发挥多层级协同的潜力。NL范式借鉴人类大脑的记忆机制,将模型重构为嵌套式优化体系,不同层级以差异化频率更新,实现短期记忆与长期规律的分层管理。

该研究提出三大核心创新:深度优化器通过神经网络预判梯度变化,替代传统优化器的固定公式;自我修改模型使架构在训练中自主调整参数,无需人工干预;连续记忆系统将二元记忆结构升级为多尺度记忆链,不同模块分别处理实时细节与长期规律。这些创新最终凝聚为Hope模型,在760M至1.3B参数规模下,其语言建模能力与推理水平均超越Transformer等主流模型,在Wiki文本困惑度、物理常识推理等指标上表现尤为突出。

这项研究的背后站着一位特殊的清华姚班校友——钟沛林。这位2016届毕业生在高中时期已是国际信息学竞赛的明星选手,2012年代表雅礼中学夺得IOI金牌,与发小艾雨青并称"雅礼双子星"。哥伦比亚大学博士毕业后,他加入谷歌纽约研究院担任算法科学家,期间主导了嵌套学习范式的研究。如今这对双子星已先后入职meta,分别担任AI科学家与软件工程师,继续在人工智能领域开拓新方向。

嵌套学习范式的提出标志着深度学习架构的范式转移。通过模拟人类认知机制,该研究为模型持续学习、长上下文推理等难题提供了全新解决方案。当AI模型从静态计算网络进化为分层协作的智能系统,或许将开启真正具备终身学习能力的通用人工智能新时代。

马斯克预言引热议:超级AI时代或将加速来临,人类准备好了吗?
更高一级的是人工通用智能(Artificial General Intelligence, AGI),即具备与人类相当的认知能力——能学习、推理、决策、解决问题,且无需为每个新任务重新训练。这种“场景化、有…

2025-11-21

微博15亿参数小模型VibeThinker:7800美元成本,数学赛场逆袭“大块头”
需要说明的是,VibeThinker目前发布的版本尚处于实验性版本,其研发重点主要集中于极大强化小模型复杂数学与竞赛编程等方面的能力,其在日常聊天等能力还没有做过针对性训练优化,所以暂不适合作为日常聊天工具…

2025-11-21

亚马逊与伊利诺伊大学创新突破:让AI助手“牢记”复杂规则高效工作
研究团队特意让GTAPolicy的训练数据非常有限,只有几百个例子,这就像让员工在信息很少的情况下学会工作技能,这样更能测试AI助手的真实学习能力。研究团队担心AI助手在专门学习工作规则的过程中,会不会损失…

2025-11-21

2025乌镇峰会圆满收官:聚焦数智未来,发布多份成果助力全球共享红利
2025年世界互联网大会乌镇峰会吸引了来自130多个国家和地区的1600多名嘉宾现场参会。 峰会期间还发布了《携手构建网络空间命运共同体十年回顾与展望》《中国互联网发展报告2025》《世界互联网发展报告20…

2025-11-21

罗福莉官宣加盟小米MiMo团队!AGI愿景下或发力世界模型与具身智能
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-21

AI迈向“效果涌现”新阶段,李彦宏:百度成果频出引领健康产业格局
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-21

DLR研究:针织钢丝网PTL助力绿色制氢,性能效率双提升
-在2A cm-2时降低了74mV的电池电压,这意味着在苛刻的条件下更低的能量使用。 针织钢丝网PTL的行为就像精密工程的弹簧,在压缩下适应,均匀分布夹紧力,并保持与催化剂层的可靠接触。针织钢丝网提供了柔韧…

2025-11-21

豪鹏科技固态电池技术突破:固液态达950Wh每升 全固态2026年将试产
11月13日,豪鹏科技(001283.SZ)在深交所互动易上表示,公司固态技术研发覆盖聚合物/氧化物/硫化物三大固态主流路线,重点聚焦消费级AI终端场景,在AI端侧产品定型过程中并行三条固态技术路线,协助产…

2025-11-21