阿里巴巴的Qwen团队推出了开源大型语言模型QwQ-32B,旨在通过强化学习提升其在复杂问题解决任务中的性能。该模型以320亿参数和131072 tokens的扩展上下文长度为基础,能够在数学和编程等基准测试中与更大参数的模型相媲美,同时显存需求更低。
亮点提要:
QwQ-32B采用强化学习技术,提升复杂问题求解能力。
在数学、编程等基准测试中表现与更大参数模型相当,显存需求更低。
具备扩展上下文长度和agentic capabilities,未来将继续探索强化学习的潜力。
详情入口:
https://qwenlm.github.io/blog/qwq-32b/
腾云数据-为您提供快速、稳定、安全的专业云计算服务。www.qqidc.com.cn,联系QQ:810379922 新浪微博:腾云数据
本文链接: https://www.qqidc.com.cn/keji/370.html