媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

生数科技Vidu Q1大模型发布:视频动作行为,皆可精准调控

2025-03-29来源:ITBEAR编辑:瑞雪

近日,清华大学人工智能研究院的一项重大创新引发了业界的广泛关注。该研究院副院长、同时也是生数科技创始人及首席科学家的朱军,正式推出了名为Vidu Q1的高可控视频大模型,这一成果被标榜为行业内首个具备高度可控性的AI视频大模型。

据官方介绍,Vidu Q1在多个关键技术领域实现了显著突破,尤其是在多主体细节可控性、音效同步控制以及画质增强方面。以多主体细节可控为例,该模型不仅能够基于语义指令进行操作,还能融入参考图的视觉信息,进一步实现对视频中多个主体位置、大小、运动轨迹等属性的精确控制。无论是角色的出场顺序、退场方式,还是坐立姿态、行动路线,Vidu Q1都能进行细致入微的调整,以满足用户的多样化需求。

在音效同步控制方面,Vidu Q1同样表现出色。它能够根据视频环境的变化和画面的切换,自动生成相应的音效,并实现对音效长短区间和出现时间点的精准控制。例如,在视频的前两秒内,可以精确设置风声作为背景音效,而在接下来的三到五秒内,则切换为雨声,从而营造出更加真实、生动的视听体验。

这一创新成果的问世,标志着AI视频生成技术迈上了一个新的台阶。Vidu Q1的高可控性不仅为用户提供了更加灵活多样的视频创作方式,也为视频制作、动画制作、广告创意等行业带来了全新的可能性。可以预见,随着该技术的不断成熟和推广,它将在未来发挥更加重要的作用,推动相关行业的快速发展。

马斯克800亿押注xAI:通用人工智能赛道上的资本、技术与未来之争
资本门槛的重塑:没有数十亿美元储备,已无法参与AGI的核心竞赛 时间压缩的必然:技术迭代周期从年缩短至月,慢即是死生态竞争的升级:单一产品公司让位于生态系统间的对抗 监管紧迫性的凸显:私营公司以国家级的…

2026-01-13

太空光伏新蓝图:霍尔电流传感器如何助力马斯克打造100GW天基能源梦
太空光伏,本质是一个在轨道上的“超级直流电站”先不说这个计划能不能实现,或者可以实现但何时能实现,也不讨论卫星如何送光伏组件上去,再如何安装光伏板等具有挑战性问题,都不是本文重点讨论的话题,我们仅从电力电力…

2026-01-13