当前位置：首页> 腾云科技> 正文

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

腾云科技
腾云科技
2025-03-06 20:22:48
471

阿里巴巴的Qwen团队推出了开源大型语言模型QwQ-32B，旨在通过强化学习提升其在复杂问题解决任务中的性能。该模型以320亿参数和131072 tokens的扩展上下文长度为基础，能够在数学和编程等基准测试中与更大参数的模型相媲美，同时显存需求更低。

亮点提要：

QwQ-32B采用强化学习技术，提升复杂问题求解能力。

在数学、编程等基准测试中表现与更大参数模型相当，显存需求更低。

具备扩展上下文长度和agentic capabilities，未来将继续探索强化学习的潜力。

详情入口：

https://qwenlm.github.io/blog/qwq-32b/

本站内容来源于网络，并不代表本站立场！版权归原作者所有，转发请注明来源，文章内容仅供参考。
腾云数据--为你提供快速、稳定、安全的专业云计算服务。www.qqidc.com.cn 联系QQ：810379922
本文链接： https://www.qqidc.com.cn/keji/370.html

上一篇
全球首款通用智能体！Manus开启内测爆火网友都在求Manus邀请码

下一篇
OpenAI宣布GPT-4.5逐步面向所有ChatGPT Plus用户开放

最新文章