捨棄輝達!DeepSeek新模型將採用華為晶片 未來幾週內亮相

分享:

大陸AI領域領頭羊「深度求索」(DeepSeek)即將推出新一代旗艦模型「V4」,市場最新消息指出,該模型將打破業界長期依賴輝達的慣例,改採華為最新設計的國產晶片運作。此舉不僅顯示大陸在算力自主化方面邁出重要一步,更引發阿里巴巴、字節跳動及騰訊等科技巨頭的連鎖反應,紛紛下單訂購數十萬枚華為新晶片。

外傳DeepSeek正在研發的V4模型預計將在未來幾週內正式亮相。(示意圖/《路透社》)

攜手華為與寒武紀優化代碼 DeepSeek-V4 傳本月發布

根據《路透社》引述美國科技媒體《The Information》的報導指出,DeepSeek正在研發的V4模型預計將在未來幾週內正式亮相。消息人士透露,為了確保模型與國產硬體高度契合,DeepSeek研發團隊過去數月來與華為及另一家大陸晶片研發商「寒武紀科技」緊密合作,重新編寫部分底層代碼並進行密集的壓力測試,以確保在國產算力平台上的運行效能達到最佳化。

此外,DeepSeek此次並未遵循業界慣例將新模型送交美國晶片商進行性能優化,而是選擇將早期測試權限開放給華為等國內供應商。據了解,V4屆時將推出三種針對不同功能優化的變體版本,所有版本均以國產晶片架構為基礎開發,目標是建立從軟體到硬體完全自主可控的技術鏈結。

此前據消息人士透露,華為意在挑戰輝達大陸市場地位的新款AI晶片客戶測試反應良好。(示意圖/《路透社》)

事實上,DeepSeek先前推出低成本模型V3與R1時,曾因其高效能與低預算的特點引發全球科技股震盪,促使投資人重新思考美系AI企業投入數十億美元購買算力設備的必要性。如今V4選擇走一條「去美化」的路線,其性能表現是否能延續前代的震撼力,已成為全球科技產業與資本市場高度關注的焦點。

儘管市場預期V4有望成為最強大的開源模型之一,但也有觀察家提醒,大陸目前的先進製程技術大致維持在5奈米水準,與全球頂尖技術仍有落差。在實際的大模型運算環境下,華為晶片的穩定性與效能是否能與輝達抗衡,仍有待V4正式發布後,經由實際應用場景進一步驗證。

此前,有大陸媒體曾傳V4將在4月發布,並稱它很大機率仍是開源最強模型,「但很難是碾壓級的強」。

留言衝人氣 8則留言

登入留言有機會獲得旺幣哦!
NO MESSAGE 無任何留言,趕緊搶頭香!