【賴傳媒 王俊勝/綜合報導】AI 模型又進化了!由中國團隊研發的 DeepSeek 本週釋出 V3 系列的小更新版本「DeepSeek-V3-0324」,雖然只是小改版,但在中文寫作、邏輯推理、代碼生成與搜尋能力上都有明顯提升,實測甚至在數學與程式評測上超車 GPT-4.5 與 Claude 3,讓不少 AI 使用者眼睛為之一亮。
這次釋出的 V3-0324 雖然沿用原本的基礎架構,但透過強化後訓練流程,讓模型在幾項核心任務的表現大幅提升。根據官方報告,新版模型在數學(MATH-500、AIME 2024)、百科知識(MMLU-Pro)、即時程式任務(LiveCodeBench)等測試中都取得優異成績,推理與代碼能力接近甚至超越同級對手。
在模型定位上,DeepSeek R1 偏向處理複雜推理題目,V3 則主打日常應用對話。不過這次更新後的 V3,也補強了邏輯與語言結構能力,變得更適合中長篇內容生成、中文寫作與資訊查找。不論是寫報告、產出文章、生成搜尋摘要,整體表現都更貼近人類語言邏輯,實用性更上一層樓。
在搜尋應用方面,V3-0324 的表現也不容小覷。根據實測,模型可以根據最新網路資料進行整理、提取重點、並生成排版清晰的完整報告,對於需要快速掌握某個議題或整理大量資料的用戶來說,是個頗具潛力的助手。
官方強調,這次版本更新並未更動基礎模型本體,主要是針對「後訓練方法」進行優化,並融入先前 R1 模型在強化學習過程中的經驗成果。與此同時,DeepSeek 仍維持開源策略,強調透明開發、持續優化,與目前不少對手「混合大模型閉源」的趨勢形成對比。
目前用戶只需關閉「深度思考模式」,即可直接體驗 V3-0324 更新內容,API 使用方式則維持不變。