中國 AI 崛起:DeepSeek V3-0324 領先全球非推理 AI – 李梓敬 –

中國 AI 崛起:DeepSeek V3-0324 領先全球非推理 AI

DeepSeek V3-0324 近日成為 Artificial Analysis Intelligence Index 上得分最高的 非推理(non-reasoning) 模型,超越 Google Gemini 2.0 Pro、Anthropic Claude 3.7 Sonnet 和 Meta Llama 3.3 70B 等專有 AI。雖然仍落後於推理型 AI,如 DeepSeek 自家的 R1 和 OpenAI 產品,但這項成就顯示開源 AI 在低延遲應用上的潛力。

非推理 AI 的新標準

DeepSeek V3-0324 屬於 非推理 AI,即能夠即時生成回應,而無需深度計算,適用於 即時聊天機器人、客服自動化與即時翻譯 等場景。這次更新確立了開源 AI 在這類應用中的領先地位,甚至超越了許多封閉式專有技術。

該模型沿用了 2024 年 12 月版本的主要配置,包括:

  • 128k 上下文窗口(API 限制至 64k)
  • 6710 億總參數(FP8 精度下需 700GB 以上 GPU 記憶體
  • 370 億活躍參數
  • 僅限文本處理(無多模態支持)
  • MIT 開源許可證

雖然這款 AI 屬於開源,但其高昂的運算需求仍然限制了普通用戶的直接使用。

目前,專有推理 AI(如 DeepSeek R1)仍在更複雜的任務中佔據優勢,但 DeepSeek V3-0324 已經逐步縮小差距。三個月前,DeepSeek V3 幾乎追上了 Anthropic 和 Google 的非推理型 AI,但仍略遜一籌。如今,V3-0324 已正式超越所有專有非推理 AI,成為業界領先的開源選擇。

專家 Artificial Analysis 形容這次發佈「甚至比 R1 更具突破性」,標誌著 開源 AI 技術競爭力的提升。DeepSeek 的進步顯示,開源框架正在挑戰封閉式 AI,為開發者與企業提供更具彈性的選擇。