媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

蔡浩宇AI公司发力:LPM 1.0视频大模型亮相 探索虚拟世界新可能

2026-04-11来源:快讯编辑:瑞雪

近日,AI领域迎来一项重要突破——Anuttacon技术团队发布了名为LPM 1.0的基于视频的角色表演模型。该模型由24位研究人员共同参与开发,能够实现实时说话、唱歌、倾听、反应及表情生成,为角色对话、虚拟直播、游戏NPC等场景提供了全新的技术解决方案。

据介绍,LPM 1.0是面向单人全双工音视频对话的表演大模型,针对现有视频生成模型在表现力、实时推理和长时身份稳定性等方面的不足进行了针对性优化。团队构建了以人为中心的多模态数据集,通过训练17B参数的Base LPM并蒸馏为低延迟流式的Online LPM,实现了无限时长下身份一致的实时视频生成与细腻拟人化表演。团队还打造了首个交互角色表演基准LPM-Bench,在各项评估中取得领先成果,为对话代理、直播角色和游戏NPC提供了通用视觉引擎。

从技术实现来看,LPM 1.0支持多模态输入,用户可通过1张图片、可选参考图片、音频及文本生成角色表演视频。模型采用全局外观参考、多视角身体图像与面部表情参考素材等多维度身份稳定要素,有效规避了牙齿、表情纹路等细节的错误生成问题。同时,该模型无需微调即可支持写实、2D动漫、3D游戏及非类人生物等不同角色风格,展现出强大的泛化能力。

在互动体验方面,LPM 1.0支持全双工实时对话,双方可同时说话、倾听并随时打断,模型会通过停顿、身体节奏和目光转移等细节增强真实感。非对话场景中,角色独处时也会展现自然的呼吸节奏和情感表达。与同类技术相比,LPM 1.0在视觉忠实度、口型精准度、身份保护及自然感等方面表现突出,且支持任意长度内容生成,突破了Kling-Avatar 2.0和OmniHuman 1.5等模型30秒的时长限制。

尽管技术优势显著,但Anuttacon团队目前并无公开模型权重、源代码或在线演示的计划。此次发布主要用于展示研究进展,供学术交流使用。不过,这一动作被解读为团队扩大AI人才招聘的信号。据悉,Anuttacon由米哈游创始人蔡浩宇创办,其技术探索方向与米哈游在AI领域的布局密切相关。例如,米哈游此前已在《崩坏:星穹铁道》中尝试应用AI工具管理角色行为、优化3D建模及生成NPC台词,并计划通过AI驱动实现“对话永不重复的智能NPC”。

米哈游的AI布局不仅限于游戏开发。2025年,该公司发布崩坏IP项目组AI专项招募计划,聚焦“AI驱动提效”与“AI驱动创新”,已搭建AI Agent平台Echo及多个游戏开发管线应用。米哈游三位创始人还通过捐赠助力上海交通大学“AI未来基石基金”,为技术人才储备铺路。从试验性AI游戏《Whispers from the Star》到AI聊天产品AnuNeko,再到如今的LPM 1.0,米哈游的技术进化路径逐渐清晰。其生活模拟新作《星布谷地》首次测试中已推出支持自由文字对话的AI NPC,进一步验证了AI与游戏结合的可行性。

光合泰智获物理驱动算力中心能源预测专利 展现科技新成果
国家知识产权局信息显示,光合泰智(杭州)科技有限公司取得一项名为“物理驱动的算力中心的数字原生模型能源预测方法及系统”的专利,授权公告号CN121503302B,申请日期为2026年1月。 天眼查资料显示,光…

2026-04-11

太空算力专委会发力:星载AI芯片与太空光伏引领太空科技新突破
在此背景下,太空算力专委会应运而生,致力于推动太空科技在星载AI芯片与太空光伏等关键环节的突破与创新。与此同时,太空光伏技术也是专委会关注的重点之一。 除了技术研发外,专委会还积极推动太空科技的应用与普及。…

2026-04-11