媒体界
行业纵横 资讯速递 科技前沿 峰会论坛 企业快讯 商业快讯

Kimi携手阿里云:AI Agent落地背后的技术协同与生产级底座构建

2026-01-29来源:快讯编辑:瑞雪

在人工智能领域,AI Agent正逐步从概念走向实际应用,成为推动行业创新的重要力量。Kimi作为这一领域的先行者,通过将Agent能力融入具体产品,不仅推出了“深度研究”、“Agentic PPT”、“OK Computer”及“数据分析”等多项创新技能,更在C端业务中成功承载了数以万计的并发请求,展现了强大的技术实力和市场潜力。

面对如此庞大的用户需求,Kimi在基础设施层面进行了深度布局。为了确保每一次请求都能得到快速响应,Kimi与阿里云展开了深度合作,以阿里云容器服务Kubernetes版ACK和阿里云容器计算服务ACS的Agent Sandbox为核心,构建了一套端到端的Agent Infra基础设施体系。这一体系不仅为Kimi的Agent产品提供了强大的算力支持,更在弹性、成本、稳定性等方面实现了全面优化。

AI Agent的落地并非易事,它要求系统能够理解复杂的用户意图,并自主分解任务、调用工具、执行并完成一系列多步骤工作流。在“深度研究”和“OK Computer”等场景中,Kimi的Agent通过自然语言指令,驱动虚拟计算机沙箱环境自动化执行复杂任务流,包括工具调用、联网搜索、代码调测等。这一过程中,系统需要同时处理数以万计的用户请求,每个请求都可能触发一次或多次Agent的复杂推理和工具调用,对系统的即时响应能力和资源分配效率提出了极高要求。

为了应对这些挑战,Kimi在沙箱环境的弹性能力与启动速度上进行了重点突破。传统的虚拟机或容器部署方式启动时间较长,对于需要即时响应的Agent服务而言难以接受。为此,Kimi采用了ACS Agent Sandbox技术,该技术基于轻量级虚拟机(MicroVM)技术,将虚拟化开销降低90%,实现了大规模并发弹性下的秒级启动。同时,通过预测预调度、资源复用等手段,进一步节省了沙箱环境的调度、创建时间,确保了系统的高效运行。

除了即时响应能力外,Kimi还注重沙箱环境的隔离性与安全性。由于Agent会执行由大模型生成的未经人工验证的代码,沙箱必须提供强隔离能力,防止其对其他租户、宿主机或其他关键系统造成影响。为此,Kimi采用了硬件级别的计算安全隔离环境,结合Network Policy、Fluid等能力增强,提供了Pod级别网络、存储的端到端安全运行环境。

在满足即时响应和安全隔离的同时,Kimi还面临着如何保持沙箱状态连续性以及应对大规模并发带来的调度压力等挑战。对于需要长时间运行的Agent任务,沙箱需要具备灵活的状态保持与恢复能力,以便在任务暂停后能够快速恢复到之前的执行点。为此,Kimi引入了实例休眠及唤醒能力,支持沙箱环境的一键休眠和快速唤醒,确保了任务的连续性。同时,通过构建常态算力与Serverless算力的分级调度体系,Kimi成功应对了大规模并发带来的系统稳定性问题,实现了容量确定性、弹性速度与成本优化的平衡。

在成本控制方面,Kimi同样表现出色。通过合理的资源调度策略,Kimi实现了按需弹性进行稳定的资源调度,以最低的成本支撑了海量并发。特别是在使用ACS Agent Sandbox的过程中,Kimi通过内存状态的持久化技术,在休眠期间释放了沙箱的CPU和内存资源,降低了休眠期间的资源成本。同时,支持数秒快速唤醒Pod的功能,使得Kimi在成本与体验之间找到了最佳平衡点。

随着用户规模的扩大和业务需求的不断升级,Kimi对基础设施的要求也越来越高。为了确保在如此大规模的负载下集群依然能够稳定运行,Kimi对Kubernetes的核心组件进行了深度优化和加固。在调度器层面通过参数调整提高了队列处理深度以及单个Pod的处理速度;在API Server层面则通过全链路端到端参数优化和管控组件动态弹性扩容等手段,满足了Agent沙箱秒级弹性、高并发API访问的诉求。

高质量的搜索和记忆服务是构建复杂Agent的关键基础。为此,Kimi借助阿里云多模数据库Lindorm构建了具备高效检索和海量存储能力的记忆与搜索模块。Lindorm作为一个多模数据库,集成了宽表引擎、搜索引擎、向量引擎、AI引擎四大核心组件,数据在内部自动流转无需自建同步链路。这一特点为Kimi快速构建Agent背后的AI搜索基础设施提供了有力支持。

从Clawdbot到Moltbot:AI Agent爆火出圈,是风口将至还是昙花一现?
不过,他也同时提示,虽然Clawdbot已经出圈,甚至可能一举造就AI Agent的出圈时刻,但其部署、使用门槛仍然较高,包括Token成本、硬件购置甚至能耗都是不小的开销,而且新手、小白即时有脚本也很难顺…

2026-01-29

AI大模型算法全解析:从原理到训练微调再到行业应用实战指南
从原理剖析到训练(微调)落地实战,这一过程不仅涉及复杂的算法设计,更需结合实际应用场景进行深度优化。 全量微调:调整模型所有参数,适用于数据充足且任务与预训练目标差异较大的场景。在医疗领域,可通过微调预训练…

2026-01-29

2025年中国开源AI崛起:阿里千问下载量超10亿 成全球最热门模型家族
今日,全球最大开源社区Hugging Face最新数据显示,阿里千问大模型开源数量突破400个,是全球AI开源社区采用率最高的模型。2025年12月Hugging Face数据显示,全球开源模型采用率排名…

2026-01-29