DeepSeek首度採用華為AI晶片,分為Pro和Flash兩個版本。(路透)
大陸AI新創公司深度求索(DeepSeek)V4預覽版本近日上線並開源,首度採用華為AI晶片,分為Pro與Flash兩版本。央視旗下新媒體《玉淵譚天》26日指,該版本距上次更新約5個月,在全球大模型快速迭代背景下,其「靜默」一度被視為落後,但此次與華為昇騰晶片體系深度適配,顯示軟硬體協同研發生態正逐步形成。
文章寫道,DeepSeek新版本距V3.2已近5個月,在海外模型平均約91天迭代一版的節奏下,其更新節奏引發討論。期間外界對V4傳聞不斷,但DeepSeek未作回應,使資訊多來自外媒與匿名消息。沉默的DeepSeek,讓人很不習慣,因其2025年初的橫空出世、用更少的算力實現更優的性能、打破美西方營造的「算力焦慮」。
文章提到,2月26日,事情迎來轉折。路透援引知情人士稱,DeepSeek在V4發布前未向輝達(NVIDIA)及AMD提供早期訪問權限,而是讓華為提前數周進行軟體適配優化,並形容此舉「breaking from standard industry practice」,即打破行業慣例,並指這種做法在過往中外大模型開發中均較為少見。
文章指出,「此次DeepSeek與華為昇騰國產晶片體系深度適配,並不令人意外。」DeepSeek早於V3.1版本即採用UE8M0 FP8 Scale參數精度,面向大陸下代國產晶片設計。而軟體主動適配硬體特性,本質上是在為國產晶片「量體裁衣」,因軟體需對算子、通信與並行策略進行調整,以適配不同晶片架構。
文章進一步稱,大陸國家發展改革委去年12月曾表示,大陸國產晶片在多場景加速適配,「超節點」等技術推動算力提升。
北京郵電大學人機互動與認知工程實驗室主任劉偉表示,模型與晶片的結合是AI競爭的重要方向,未來的AI發展,不僅在於算法的好壞,同樣也要看整個生態是否具有韌性。他並指出,輝達CUDA生態長期占據主導地位。
文章提到,在此背景下,大陸大模型與晶片體系面臨兼容既有生態或重構軟體棧的選擇。大陸大模型要想實現真正的自主,就必須形成軟硬體一體化的協同能力。
文章稱,DeepSeek-V4在適配昇騰晶片後實現高吞吐、低延遲推理部署,這是技術上的新探索,也是我們在軟硬體協同領域的一種進步訊號,智譜GLM-5亦完成與7家大陸國產晶片平台的適配測試。在大模型訓練中,也出現了「純國產」的實踐樣本,部分企業已在大陸國產算力集群上完成模型訓練。
大陸科技與戰略風雲學會副會長陳經分析,部分大模型已基於國產算力體系進行訓練,顯示軟硬體協同生態正在形成。不過文章同時提到,當前晶片製程與單卡性能仍有限,需依賴系統設計與集群架構補足。
2026/04/26 12:29
轉載自聯合新聞網: https://udn.com/news/story/7333/9465075?from=udn-ch1_breaknews-1-99-news






