TOP
關閉

阿里開源「通義千問3.0」!聲稱效能超越Grok 3與DeepSeek-R1

  • 2025-04-29 22:48:35

【賴傳媒 王俊勝/綜合報導】大陸科技巨頭阿里巴巴再度出招,今(29)日凌晨正式開源新一代大型語言模型「通義千問3.0(Qwen3)」系列,涵蓋多款密集與混合專家(MoE)架構模型,最大規模高達2350億參數。阿里強調,此次推出的旗艦模型不僅效能超越同為中國開源代表的 DeepSeek-R1,更在推理能力、程式生成與多語言應用上刷新多項測評紀錄,力拚與國際大廠一較高下。

根據官方資料,Qwen3 系列主打彈性部署與高效能表現,除了密集模型從0.6B到32B一字排開外,混合專家版本也同步推出30B與235B兩種規模,最大款Qwen3-235B-A22B雖有2350億總參數,但只需啟用其中22B即可運作,大幅壓低推理成本。

相較同級模型,阿里聲稱Qwen3在硬體資源需求上更為精簡,完整版本僅需4張H20 GPU就能運行,顯存使用約為DeepSeek-R1的三分之一,對一般企業或研究單位更具實作彈性。

效能表現方面,Qwen3 在多項開源模型評測中成績亮眼,包括在通用能力的 AIME25 測驗中拿下 81.5 分,刷新開源成績紀錄;而在程式生成的 LiveCodeBench 測試中,更超越了日前話題十足的 Grok 3;於模型人類偏好對齊的 ArenaHard 評比中,也擊敗了 OpenAI-o1 與 DeepSeek-R1,顯示其在實用性與人機互動表現上不容小覷。

這批 Qwen3 模型全數以 Apache 2.0 授權釋出,允許開發者自由下載、修改與商用,支援語言數量高達119種,為目前中文模型中最廣泛的語言涵蓋之一。不僅可透過「通義APP」免費體驗,阿里旗下的「誇克」平台未來也將全面整合這款新模型。

阿里此舉不僅展示中國AI技術自主研發的企圖心,也進一步拉高了開源模型在全球市場的能見度。隨著開源與商用門檻同步降低,Qwen3有望成為科研界與產業端的重要新工具。


您可能有興趣