近日,国家超算互联网平台传来消息,宣布将正式上线阿里巴巴开源推理模型QwQ-32B的API接口服务。据悉,用户将有机会免费获得100万Tokens的使用额度。
QwQ-32B是阿里巴巴Qwen团队最新研发的一款推理模型,其构建基础为Qwen2.5-32B与强化学习的结合。根据官方发布的基准评测结果,QwQ-32B在数学能力测试AIME24评测集以及代码能力评估LiveCodeBench中的表现,与DeepSeek-R1相当,甚至超越了o1-mini及同尺寸的R1蒸馏模型。
国家超算互联网平台迅速完成了对QwQ-32B的全面适配工作,包括基于vLLM和PyTorch的推理适配。平台同步上线了QwQ-32B的模型镜像和模型文件,用户无需下载至本地,即可一键启动Notebook功能,在平台上进行QwQ-32B模型的开发,或引入专有数据进行进一步的私有化部署。
除了QwQ-32B模型API接口服务外,国家超算互联网平台近期还推出了DeepSeek-R1全家桶、最高671B满血版的API部署与AI Web应用服务。这一系列的举措,无疑为用户提供了更为丰富和强大的AI模型选择。
对于如何使用国家超算互联网平台的QwQ-32B API调用服务,平台也给出了详细的步骤指南。用户只需在超算互联网商城首页搜索QwQ-32B,并点击“去使用”按钮,即可进入API接口信息页面。在页面中,用户可以根据需求选择访问形式,包括使用Postman、Apifox等HTTP工具访问,使用Python代码访问,以及在终端页面直接访问。
目前,国家超算互联网平台已经连接了国内14个省份的20多家超算和智算中心,平台上提供了超过6500款算力商品,其中AI模型服务近240款。这些模型服务既包括了DeepSeek、Qwen等国内开源模型,也涵盖了Llama、Stable Diffusion、Gemma等国外AI开源模型。用户可以根据自己的需求,在平台上选择适合的AI模型进行使用。