媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

京东JoyAI-Image-Edit开源:破解AI空间编辑难题,赋能多元产业应用

2026-04-08来源:快讯编辑:瑞雪

在AI图像处理领域,长期存在的空间逻辑难题正迎来突破性解决方案。京东探索研究院近日宣布开源自研的JoyAI-Image-Edit图像模型,该模型通过构建三维空间认知体系,成功解决了传统工具在物体位移、视角转换等操作中常见的变形、透视错乱等问题。这项技术突破标志着AI图像编辑从平面处理向空间重构的跨越,为电商设计、创意生产等领域带来全新可能性。

该模型创新性地融合了空间位置建模、多视角一致性算法与场景推理技术,形成完整的三维编辑能力框架。在物体操作层面,模型可精准控制位移、旋转等几何变换,确保遮挡关系与光影效果自然合理;视角转换方面,支持通过自然语言指令调整相机参数,生成符合物理规律的新视角图像;更突破性地实现了空间漫游功能,能够连续生成逻辑连贯的多视角序列,如同在虚拟场景中自由移动观察。

技术验证显示,JoyAI-Image-Edit在物体移动精度、空间布局一致性等核心指标上达到国际领先水平。其三大核心能力构成显著优势:视角变换功能允许用户自定义相机参数生成新视图;空间漫游支持创建连贯的多角度图像序列;物体关系操控可在保持场景结构稳定的前提下调整元素位置。这些能力与15类通用编辑功能深度整合,覆盖从物体替换到风格迁移的全场景需求。

在应用层面,该模型展现出强大的跨领域适配性。电商行业可利用其快速生成多角度商品展示图,创意设计领域能实现复杂场景的精准编辑,智能图像处理领域则获得更高效的三维重建工具。特别在具身智能领域,模型提供的空间理解能力为机器人环境感知技术研发奠定了关键基础,助力智能设备更好地理解物理世界。

此次开源包含完整的推理代码体系,开发者可直接调用核心功能进行二次开发。这是京东在AI多模态领域的又一重要布局,继基础大模型JoyAI-LLM Flash开源后,再次通过技术共享推动产业创新。配合近期上线的京东云"龙虾"系列产品及全球最大具身数据采集中心建设,京东正构建起覆盖算法、算力、数据的完整AI生态链,持续深化技术赋能实体经济的战略实践。

AI赋能开发:Netflix、Meta、IBM专家揭秘如何让程序员效率跃升新路径
更重要的是,根据在北卡罗来纳州达勒姆举行的全AI大会上来自IBM、Meta和Netflix等公司演讲者的观点,最佳的AI效果需要充分准备的智能体。清楚地思考你给智能体提供什么信息是上下文工程的工作,在智能体…

2026-04-08

谷歌推出Gemma 4开源AI模型,为企业AI应用提供灵活安全新选择
企业倾向于专有AI技术和开源模型的混合使用,同时考虑成本和延迟因素。 Dekate说,虽然像Gemma 4这样的开源模型在任务方面提供了灵活性,但它并不是满足公司所有需求的万能模型。不应急于将开源模型应用于…

2026-04-08

清明假期刷屏!钱塘江潮汐雕琢“潮汐树” 生态与艺术交织的自然奇景
“潮汐树”是发育在潮滩上的潮沟系统潮汐树是发育在潮滩上的潮沟系统,由潮汐作用反复冲刷形成,在河口海岸学专业上被称为“潮沟水系”。钱塘江河口段每个月有两次大潮期,每天有两次潮涨潮落,潮水不断冲刷着潮滩。 除…

2026-04-08

定制半导体刻蚀槽怎么选?厦门和伟达凭技术适配与服务成多行业优选
推荐理由:厦门和伟达的定制半导体刻蚀槽以“技术沉淀深、适配场景广、服务响应快”为核心优势,尤其适合半导体制造、光电加工、新能源等对清洗精度与工艺协同要求高的行业,可满足小批量试产到大规模量产的全周期需求。…

2026-04-08

晶澳(扬州)新光伏组件专利:汇流结构创新,助力光电效率提升
来源:市场资讯 (来源:光伏研习社) 专利摘要显示,本发明公开一种光伏组件。该光伏组件可包括:盖板、封装胶膜、电池阵列及背板;电池阵列包括:电池串、设置于电池串的端部电池片背面的汇流结构和设置于端部电池片背面…

2026-04-08