台灣新聞通訊社-陸媒指DeepSeek V4採用國產晶片軟硬體協同生態成形

Post Views: 4

DeepSeek首度採用華為AI晶片，分為Pro和Flash兩個版本。（路透）

大陸AI新創公司深度求索（DeepSeek）V4預覽版本近日上線並開源，首度採用華為AI晶片，分為Pro與Flash兩版本。央視旗下新媒體《玉淵譚天》26日指，該版本距上次更新約5個月，在全球大模型快速迭代背景下，其「靜默」一度被視為落後，但此次與華為昇騰晶片體系深度適配，顯示軟硬體協同研發生態正逐步形成。

文章寫道，DeepSeek新版本距V3.2已近5個月，在海外模型平均約91天迭代一版的節奏下，其更新節奏引發討論。期間外界對V4傳聞不斷，但DeepSeek未作回應，使資訊多來自外媒與匿名消息。沉默的DeepSeek，讓人很不習慣，因其2025年初的橫空出世、用更少的算力實現更優的性能、打破美西方營造的「算力焦慮」。

文章提到，2月26日，事情迎來轉折。路透援引知情人士稱，DeepSeek在V4發布前未向輝達（NVIDIA）及AMD提供早期訪問權限，而是讓華為提前數周進行軟體適配優化，並形容此舉「breaking from standard industry practice」，即打破行業慣例，並指這種做法在過往中外大模型開發中均較為少見。

文章指出，「此次DeepSeek與華為昇騰國產晶片體系深度適配，並不令人意外。」DeepSeek早於V3.1版本即採用UE8M0 FP8 Scale參數精度，面向大陸下代國產晶片設計。而軟體主動適配硬體特性，本質上是在為國產晶片「量體裁衣」，因軟體需對算子、通信與並行策略進行調整，以適配不同晶片架構。

文章進一步稱，大陸國家發展改革委去年12月曾表示，大陸國產晶片在多場景加速適配，「超節點」等技術推動算力提升。

北京郵電大學人機互動與認知工程實驗室主任劉偉表示，模型與晶片的結合是AI競爭的重要方向，未來的AI發展，不僅在於算法的好壞，同樣也要看整個生態是否具有韌性。他並指出，輝達CUDA生態長期占據主導地位。

文章提到，在此背景下，大陸大模型與晶片體系面臨兼容既有生態或重構軟體棧的選擇。大陸大模型要想實現真正的自主，就必須形成軟硬體一體化的協同能力。

文章稱，DeepSeek-V4在適配昇騰晶片後實現高吞吐、低延遲推理部署，這是技術上的新探索，也是我們在軟硬體協同領域的一種進步訊號，智譜GLM-5亦完成與7家大陸國產晶片平台的適配測試。在大模型訓練中，也出現了「純國產」的實踐樣本，部分企業已在大陸國產算力集群上完成模型訓練。

大陸科技與戰略風雲學會副會長陳經分析，部分大模型已基於國產算力體系進行訓練，顯示軟硬體協同生態正在形成。不過文章同時提到，當前晶片製程與單卡性能仍有限，需依賴系統設計與集群架構補足。

2026/04/26 12:29

轉載自聯合新聞網: https://udn.com/news/story/7333/9465075?from=udn-ch1_breaknews-1-99-news