实测Kimi探索版，中国版“o1大模型”来了？-行业纵横-媒体界

近期，国内大模型市场迎来了一波新的创新热潮，多家厂商纷纷推出迭代产品，其中多模态领域尤为引人注目。自年初Sora发布后，国产文生视频大模型的进展备受关注。8月底，MiniMax推出了首个AI高清视频生成模型，紧接着9月，豆包发布了两款视频生成大模型，并获得灰测用户的高度评价。与此同时，科大讯飞也宣布将发布多模态视觉交互及超拟人虚拟人交互能力。然而，在这些新产品中，一款名为Kimi探索版的工具尤为引人关注。

Kimi探索版被视为国内对标OpenAI“推理时计算”能力o1的产品。据官方介绍，它能够模拟人类的推理思考全过程，执行深度搜索并反思改进结果，从而提供更加全面和准确的答案。这一特性使其在众多大模型中脱颖而出。Kimi探索版的产品负责人甚至表示，如果Kimi搜不到的信息，用户也很难通过传统搜索引擎找到。

那么，Kimi探索版究竟有何独特之处？它在技术上是如何实现模拟人类推理和思考的呢？官方解释，Kimi探索版通过自主规划策略，将复杂问题分解为层次化的子问题，然后分步执行，这与OpenAI的o1模型所采用的马尔可夫决策过程相似。这使得Kimi探索版在处理需要多步推算判断的问题时，表现出更强的能力。

为了验证Kimi探索版的能力，我们进行了一项测试。提出问题：“假设我在2024年9月2日有100000元，对比一下截至9月30日，购买腾讯港股和购买贵州茅台哪个方案的收益率更高？具体收益额会高出多少？”Kimi探索版将这个问题分为了查询、计算和结论三个步骤，最终给出了详细的答案和解释。

Kimi探索版还具备即时反思搜索结果、补充信息的能力。面对开放探索型问题，如果第一次回答的信息存在缺失，它会主动补充更多回答。面对数字相关的搜索问题，如果发现了数据冲突，它会及时提供多方视角的信息供参考决策。这一特性使其在搜索结果的准确性和全面性上更具优势。

尽管Kimi探索版在技术和功能上取得了显著突破，但仍存在一些需要正视的问题。其中之一是其在处理不同问题时，搜索的网页数量存在差异，导致结果的不一致性。这引发了对于技术、环境或算力因素的疑问。在处理特定类型的问题时，如数英文单词中字母“e”的数量，Kimi探索版仍存在一些错误。

尽管如此，Kimi探索版的出现仍然具有重要意义。它改变了过去大模型需要繁琐提示词才能输出想要结果的情况，通过模拟人类的推理思考过程，提供了更加全面和准确的答案。这为用户节省了搜索调研任务上的时间，使其能够更专注于提出问题、思考和创造。未来，随着技术的不断完善和用户体验的提升，Kimi探索版有望在国内AI搜索与大模型发展领域发挥更加重要的作用。