媒体界
行业纵横 资讯速递 科技前沿 企业动态 峰会论坛

谷歌Fluid挑战新共识,AI文生图自回归模型力压扩散模型?

2024-10-23来源:ITBEAR编辑:瑞雪

谷歌DeepMind团队与麻省理工学院(MIT)合作推出了一款名为“Fluid”的新模型,该模型在文生图领域取得了显著成果。据科技媒体The Decoder报道,Fluid模型在参数规模达到105亿时,能够生成最佳的图像效果。

在文生图领域,自回归模型与扩散模型一直存在竞争。扩散模型通过迭代减少随机噪声来生成高质量数据,而自回归模型则依赖于序列中的前面元素来预测下一个元素。

Fluid模型之所以能够在文生图领域脱颖而出,关键在于其采用了连续tokens和随机生成顺序两个创新设计。连续tokens能够更精确地图像信息存储,减少信息丢失,而随机生成顺序则让模型在每一步都能预测任意位置的多个像素,从而更好地理解整体图像结构。

在重要基准测试中,Fluid模型超越了Stable Diffusion 3扩散模型和谷歌此前的Parti自回归模型。与Parti相比,Fluid在参数规模远小于Parti的情况下,仍能在MS-COCO上达到相同的FID分数。

Arm拟取消高通芯片设计许可,双方回应引关注
10 月 23 日消息,今天早些时候,报道了 Arm 拟取消允许长期合作伙伴高通使用 Arm 知识产权设计芯片许可的消息。这是 Arm 的一贯做法 —— 更多毫无根据的威胁,旨在强行压迫…

2024-10-23

行业“内卷”下,车企“博眼球”式营销何时休?
“车上吃火锅”的宣传暴露出了一个行业事实:在如今极度内卷的中国汽车市场上,面对越来越同质化的产品,车企们需要在宣传上出奇制胜,让消费者真正记住,从而帮助销量的提升。业内专业人士认为,在整个汽车市场陷入无限“内…

2024-10-23