媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

蚂蚁数科AoE框架:低成本轻量化方案破解具身数据采集难题

2026-03-03来源:互联网编辑:瑞雪

具身智能领域迎来一项关键技术进展——蚂蚁数科天玑实验室团队开发的AoE持续性第一人称视频采集框架,成功攻克了低成本、规模化数据采集难题。该方案通过“手机+颈挂式支架”的轻量化组合,将传统需要数万美元的专业设备成本压缩至20美元以内,为具身智能训练提供了可复制的解决方案。相关技术论文已在国际学术平台Arxiv公开,标志着数据采集环节的技术壁垒被实质性突破。

技术核心在于将人体自然交互过程转化为标准化数据源。团队设计的颈挂式支架采用人体工学结构,通过磁吸与机械夹具双重固定方式,确保手机在胸前稳定采集第一视角画面。这种设计不仅支持毫米级轨迹追踪,还能保持90%以上的手部关键点识别精度。实验数据显示,在Unitree G1机器人执行关电脑任务中,仅需200条AoE采集的数据,即可将操作成功率从45%提升至95%,显著优于传统遥操作数据的训练效果。

针对长视频处理难题,研究团队构建了端云协同的自动化流水线。端侧轻量级视觉模型可实时识别手物交互行为并触发精准录制,大语言-视觉融合模型则将连续视频切割为带语义标签的原子动作片段。云端系统进一步完成自动标注、异常数据过滤等处理,最终生成可直接用于模型训练的结构化数据。这种处理方式使数千台设备并发采集成为可能,同时将人工干预环节减少80%以上。

该技术的产业化应用已进入快车道。AoE框架不仅解决了数据采集的“启动学习”问题,更通过标准化流程降低了AI训练门槛。以金融场景为例,某银行采用该方案后,柜员操作数据采集效率提升3倍,模型迭代周期缩短60%。这种低成本、高效率的数据生产模式,正在重塑具身智能的技术生态。

蚂蚁数科的技术布局呈现明显的产业导向特征。天玑实验室同步推进AI+数据、AI+安全、AI+金融等四大方向,其研发的企业级大模型产品即将面世。今年初成立的“大模型技术创新部”,已启动面向制造业、物流业的垂直领域模型开发,预计年内将落地5个以上行业解决方案。

阿里巴巴整合大模型品牌:千问统一B端C端,春节DAU达7352万
封面新闻记者 欧阳宏宇3月2日,记者获悉,阿里巴巴已将大模型B端品牌和C端应用品牌统一为千问。千问大模型(Qwen)涵盖基础大模型和专业领域模型,千问APP是阿里巴巴在C端的旗舰AI应用。 据悉,此举是为了…

2026-03-03

AI赋能软件业:大模型Coding与行业Agent如何重塑行业格局与机遇
本报告围绕大模型公司的Coding能力与行业Agent发展对软件行业的影响展开分析,指出AI辅助编程推动软件开发效率提升、门槛降低,对软件行业的影响因产品功能、应用场景和行业领域差异而不同,其中标准化程度高…

2026-03-03

AI数字人智能体:大模型赋能下开启全场景人机协同新篇章
作为深耕于此的专业服务商,我们正致力于将这套先进能力,转化为即取即用的全场景解决方案,推动智能技术在千行百业实现深度落地应用,从本质上重塑服务与运营的范式。 基于这一强大内核,AI数字人智能体正将技术势能转化…

2026-03-03

太阳之变:从物质“核聚变”到精神“和巨变”的觉醒之旅
当每一个个体都能实现内在的“和-巨变”,人类社会便能摆脱“核武器”的恐惧与“竞争”的内耗,真正步入一个处处洋溢着“和善互爱”的“唯悟主义”新纪元。抬头仰望太阳,我们看到的不仅是“氢”与“氦”的物理反应,更是“…

2026-03-03