蚂蚁AlignXplore+：以文本建模破局大模型个性化，8B小模型实现跨域通用新突破-资讯速递-媒体界

在人工智能大模型竞争日益激烈的当下，如何打造一款能精准“抓住”用户的爆款应用，成为众多开发者关注的焦点。当算力与性能不再是唯一优势，个性化技术成为关键突破口。传统推荐系统和对话模型依赖ID Embedding或特定参数表示用户偏好，这种“黑盒”范式存在不可解释、难以迁移等问题，限制了个性化发展。而大模型强大的推理与生成能力，为打破这一局限带来新契机，推动个性化从“黑盒”走向“白盒”。

近日，一支由蚂蚁与东北大学研究人员组成的团队，在大模型个性化领域取得重要进展，推出AlignXplore+。该成果实现文本化用户建模新范式，让复杂用户偏好既能被人理解，也能被机器解读，还具备良好扩展性与迁移性。传统个性化技术路线下，无论是静态用户向量还是为每个用户微调模型，本质都是不透明的“黑盒”。团队指出，这种表示方式存在两大痛点：一是不可解释性，用户无法理解、修改系统定义的“自己”，在注重隐私与控制权的AI Agent时代难以接受；二是无法迁移，向量和参数与特定模型架构深度绑定，推荐系统里的兴趣无法被聊天机器人复用，不同模型间的画像也难以通用。

基于这些思考，团队提出范式转移：摒弃隐空间向量，直接用自然语言归纳和推理解析用户偏好。这种基于文本的偏好归纳，人眼可读、可控，且完全解耦偏好推理与下游模型和任务。无论是推荐、写作还是闲聊，也无论是GPT、Llama还是Qwen，都能无缝“读懂”用户。

AlignXplore+具有三大核心特性，重构用户理解范式。其一，全域通用，打破数据孤岛。它不局限于单一交互形式，可处理真实世界中异构数据源，如社交网络发帖、电商平台点击、新闻流浏览记录等，能提炼高价值偏好摘要，拼凑完整用户全貌。其二，极致迁移，一次画像，处处通用。从单一任务到全能应用，它打破任务边界，将能力扩展到推荐和生成等广泛个性化应用；从特定模型到通用接口，实现跨模型迁移，生成的画像可被任何下游大模型直接读取使用。其三，实战适配，无惧真实世界数据噪点。真实世界交互流式且充满噪点，AlignXplore+无需每次都重新“阅读”用户所有历史，像人类记忆一样，基于旧摘要和新交互不断演化；面对“不完美信号”，如缺乏明确负反馈的数据和跨平台混合数据，仍能保持稳定推理能力，免受噪音干扰。

AlignXplore+是一个面向大模型个性化对齐的统一框架，核心目标是让大模型在不重训、不续训前提下持续理解用户。该框架包含两个主要阶段。SFT阶段通过“生成 - 验证 - 合并”流程创建高质量训练数据，确保对多个未来交互的准确预测，综合生成全面偏好总结。RL阶段采用课程剪枝策略，选取推理密集型样本，并通过累积奖励函数优化偏好总结，提升流式场景中的长期有效性。

在这个框架下，团队将“用户偏好学习”拆解为两个核心步骤。SFT阶段，为解决文本化偏好归纳“太泛”或“太偏”问题，设计一套流程，让模型基于多种可能未来交互行为反推当前偏好，并引入“行为验证”机制，确保生成的用户偏好能准确预测用户行为。RL阶段，仅有SFT不够，团队引入强化学习，设计课程剪枝和累积奖励两个关键机制。课程剪枝筛选出“难但可解”的高推理价值样本，避免模型在简单或不可解样本上空转；累积奖励让模型关注生成的用户偏好在未来持续交互中的可演化性，适应流式更新。

相较于现有方法，AlignXplore+在用户理解准确性、迁移能力和鲁棒性上实现全面升级。在效果上，8B参数的AlignXplore+在包含推荐、回复选择和回复生成的九大基准测试中，平均分数取得SOTA成绩，平均得分75.10%，绝对提升幅度比GPT - OSS - 20B高出4.2%，在复杂任务上表现尤为突出，验证显式推理比隐式向量更能捕捉深层意图。在迁移能力上，生成的用户偏好展现惊人Zero - shot迁移能力。跨任务迁移方面，对话任务中生成的偏好，直接指导新闻推荐依然有效；跨模型迁移方面，生成偏好给Qwen2.5 - 7B或GPT - OSS - 20B等不同下游模型使用，均能带来稳定性能提升，用户偏好不再被单一模型锁定。在鲁棒性上，真实场景往往只有用户点击记录（正样本），缺乏明确负反馈，实验表明，即便移除所有负样本，AlignXplore+依然保持显著性能优势，展现强大推理鲁棒性。用户真实历史行为跨越多种领域，实验结果显示，即使混合不同领域历史记录，AlignXplore+依然能精准捕捉多重兴趣，不像传统模型那样将兴趣“平均化”。

京东七鲜新店开业“火出圈”，价格优势让山姆超市“遇冷”

2026-02-01

百度文库网盘深度整合成立PSIG，AI赋能打造超级入口迎消费新机遇

在当今竞争愈发激烈的AI应用市场中，百度近日宣布对旗下文库与网盘两大业务进行深度整合，成立全新的个人超级智能事业群组（PSIG）。在2024年百度世界大会上，文库与网盘联合推出的自由画布产品，实现了公域与私…

2026-01-31

百度成立PSIG整合文库网盘，借AI浪潮打造用户价值新驱动商业模式

王颖在2024年百度世界大会上提到，文库的智能内容创作与网盘的个人资产管理将形成强大的联动，提升用户体验。为了进一步推动AI化进程，百度在2025年推出了全端通用智能体GenFlow3.0，结合文库和网盘的…

2026-01-31

雷军再启直播之旅：探秘小米汽车工厂实验室，畅聊SU7与热点话题

2026-01-31

新春武汉新玩法！武商梦时代机器人嘉年华，带你沉浸式“穿越”未来

2026-01-31

绿色积分消费新玩法：让积分“活”起来，驱动消费与平台共成长

2026-01-31

马斯克再掀科技狂潮：SpaceX与特斯拉等融合，太空算力机器人齐头并进

深企投产业研究相关报告表示，目前SpaceX猎鹰9号已将发射成本降至约1500美元/公斤以下，预计2030年以后SpaceX的单位发射成本降至200美元/公斤以下，为太空算力商业化铺平道路。在未来可能被“…

2026-01-31

2026雄安“人工智能+”活动启幕 “极数”大模型助力实体经济智变

中国科学院院士、清华大学人工智能研究院名誉院长张钹在发言中介绍，数据大模型的兴起标志着人工智能范式的重要转变，它的技术本质是构建能理解数据内在因果机制的“通用世界模型”，有望实现“一个模型赋能千行百业”。 …

2026-01-31

中国“人造太阳”实现亿度千秒突破开启终极清洁能源新纪元

这个被称为"人造太阳"的东方奇迹，正在改写人类能源史。在安徽合肥科学岛上，直径8米的EAST装置正闪耀着人类智慧的光芒。近百万个零部件协同运转，2000余项专利支撑，中国科学家用20年时间完成了西方同行半个…

2026-01-31

太空太阳能VS可控核聚变：中美能源博弈下，普通人投资该何去何从？

然而，这一切仍停留在理论和早期研究阶段，比已进入实验室验证的“脑机接口”还要早期。对于真正想布局未来能源的投资者而言，可控核聚变代表了一条虽漫长但可见、有持续技术进展的赛道，其投资逻辑比太空太阳能坚实得多…

2026-01-31