媒体界
行业纵横 资讯速递 科技前沿 企业动态 峰会论坛

英伟达nGPT新架构来袭,AI训练时间骤减20倍!

2024-10-22来源:ITBEAR编辑:瑞雪

科技界迎来一项重大进展,英伟达在AI模型训练领域取得了突破性成就。该公司最新发布的Normalized Transformer(nGPT)架构,在保持模型稳定性和准确性的同时,大幅缩短了训练时间,最高可达原来的二十分之一。

nGPT架构的核心在于“超球面学习”概念,通过将关键组件映射到超球面表面,确保模型各层在训练中的平衡,从而创造更稳定高效的学习过程。

与传统的GPT模型相比,nGPT在速度和效率上均表现出色。在OpenWebText数据集测试中,nGPT对于长达4000个tokens的文本输入,所需训练轮次远少于传统模型。

nGPT还将归一化和表示学习结合成一个统一框架,简化了模型架构,便于扩展和适应更复杂的混合系统。这一创新设计有望为AI系统的发展带来新的突破。

卢伟冰信心满满,小米手机澎湃OS这次能否大放异彩?
10 月 22 日消息,小米集团合伙人、总裁,手机部总裁卢伟冰在小米双 11启动仪式上自信喊话:“我作为手机部总裁,向大家做的承诺是,小米澎湃 OS 这一次肯定行!” 而在今天凌晨召开的 2024…

2024-10-22

小米新动作!首款Ultra机型Poco F7 Ultra手机曝光
10 月 22 日消息,科技媒体 gizmochina 昨日(10 月 21 日)发布博文,在挖掘 GSMA IMEI数据库后,发现了小米 Poco F7 Ultra 手机的踪迹,这也是 Poco…

2024-10-22

马斯克发布会AI“致敬”《银翼杀手》,遭制作方起诉
10月22日消息,特斯拉本月在“We,Robot”发布会中展示了Cybercab等全新车型,但由于“致敬”了《银翼杀手2049》中的镜头,马斯克被后者制作公司之一指控侵权。据TheVerge,北京时间…

2024-10-22