本文作者:访客

阿里开源新一代通义千问模型Qwen3

访客 2025-04-29 10:22:40 31728
阿里开源新一代通义千问模型Qwen3摘要: 【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以...

【大河财立方消息】4月29日早间,阿里巴巴开源新一代通义千问模型Qwen3。

阿里开源新一代通义千问模型Qwen3

此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与一众顶级模型相比,表现出极具竞争力的结果。

小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B10%,表现更胜一筹,Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。

目前,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3,夸克也即将全线接入Qwen3。

责编:陶纪燕 | 审核:李震 | 监审:古筝

文章版权及转载声明

作者:访客本文地址:https://ddwi.cn/ddwi/9154.html发布于 2025-04-29 10:22:40
文章转载或复制请以超链接形式并注明出处爱美网

阅读
分享