
阿里开源新一代通义千问模型Qwen3

【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。
此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。
小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹,Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。
目前,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3,夸克也即将全线接入Qwen3。
责编:陶纪燕 | 审核:李震 | 监审:古筝
文章版权及转载声明
作者:访客本文地址:https://ddwi.cn/ddwi/9154.html发布于 2025-04-29 10:22:40
文章转载或复制请以超链接形式并注明出处爱美网