阿里開源「通義千問3.0」！聲稱效能超越Grok 3與DeepSeek-R1

2025-04-29 22:48:35
- 科技新知

【賴傳媒王俊勝／綜合報導】大陸科技巨頭阿里巴巴再度出招，今（29）日凌晨正式開源新一代大型語言模型「通義千問3.0（Qwen3）」系列，涵蓋多款密集與混合專家（MoE）架構模型，最大規模高達2350億參數。阿里強調，此次推出的旗艦模型不僅效能超越同為中國開源代表的 DeepSeek-R1，更在推理能力、程式生成與多語言應用上刷新多項測評紀錄，力拚與國際大廠一較高下。

根據官方資料，Qwen3 系列主打彈性部署與高效能表現，除了密集模型從0.6B到32B一字排開外，混合專家版本也同步推出30B與235B兩種規模，最大款Qwen3-235B-A22B雖有2350億總參數，但只需啟用其中22B即可運作，大幅壓低推理成本。

相較同級模型，阿里聲稱Qwen3在硬體資源需求上更為精簡，完整版本僅需4張H20 GPU就能運行，顯存使用約為DeepSeek-R1的三分之一，對一般企業或研究單位更具實作彈性。

效能表現方面，Qwen3 在多項開源模型評測中成績亮眼，包括在通用能力的 AIME25 測驗中拿下 81.5 分，刷新開源成績紀錄；而在程式生成的 LiveCodeBench 測試中，更超越了日前話題十足的 Grok 3；於模型人類偏好對齊的 ArenaHard 評比中，也擊敗了 OpenAI-o1 與 DeepSeek-R1，顯示其在實用性與人機互動表現上不容小覷。

這批 Qwen3 模型全數以 Apache 2.0 授權釋出，允許開發者自由下載、修改與商用，支援語言數量高達119種，為目前中文模型中最廣泛的語言涵蓋之一。不僅可透過「通義APP」免費體驗，阿里旗下的「誇克」平台未來也將全面整合這款新模型。

阿里此舉不僅展示中國AI技術自主研發的企圖心，也進一步拉高了開源模型在全球市場的能見度。隨著開源與商用門檻同步降低，Qwen3有望成為科研界與產業端的重要新工具。

阿里開源「通義千問3.0」！聲稱效能超越Grok 3與DeepSeek-R1

您可能有興趣

特別推薦

熱門新聞