國產開源大模型DeepSeek憑借出色性價比,成為全球增速最快的AI應用,引發全球科技圈熱切討論和算力信仰震蕩,也進一步增強對構建開放型人工智能生態的信心。目前,不僅英偉達、AMD、英特爾等國際芯片巨頭宣布集成DeepSeek模型、提供算力支持等,國產GPU廠商、云計算廠商和應用廠商等AI產業鏈伙伴也火速支持調用DeepSeek,升級各自產品和技術。
引發算力巨震
作為幻方量化旗下的AI公司深度求索研發的國產開源大模型,DeepSeek近期連續發布DeepSeek-V3、DeepSeek-R1等AI模型展示了驚艷效果。其中,DeepSeek-V3在多語言編程測試排行榜中,僅次于OpenAIo1大模型,在數學能力方面超過了所有開源閉源模型,而訓練成本總計557.6萬美元,遠低于GPT-4等模型高達數億美元的訓練成本。
移動應用分析機構SensorTower的數據顯示,其應用軟件在18天內的下載量達到1600萬次,截至2025年2月4日,DeepSeek日活用戶數超越了2000萬,成為全球增速最快的AI應用。
人工智能行業業內人士向e公司記者表示,DeepSeek證明了不用堆疊算力也可以搞好大模型。
綜合來看,DeepSeek提供了一種高效的模型蒸餾技術,能夠將大規模模型的能力遷移至更小、更高效的版本,并且通過Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術,顯著降低顯存占用,優化模型性能。
TrendForce集邦咨詢研究指出,DeepSeek采用蒸餾模型(Model Distillation)技術,壓縮大型模型以提升推理速度并降低硬件需求,同時充分發揮英偉達Hopper降規版芯片的效益,最大化運算資源利用。其成本優勢來自高效能硬件選擇、新型蒸餾技術及API開源策略,不僅優化技術與商業應用的平衡,也展現AI產業向高效發展的趨勢。
DeepSeek成為現象級AI應用,也引發了對算力信仰的質疑。全球算力巨頭英偉達股價1月27日一度下跌近17%,之后逐步企穩;A股光通訊模塊龍頭中際旭創1月27日下跌約10%,2月5日進一步放量下跌,工業富聯下跌6.76%,寒武紀-U下跌12.46%。
對此,英偉達此前發表聲明,表示DeepSeek所取得的進展顯示出其芯片在中國市場的實用價值,且未來為滿足DeepSeek的服務需求,還將需要更多英偉達芯片。
另外,全球數據中心建設還將繼續推進,推升光模塊需求。TrendForce集邦咨詢最新指出,DeepSeek模型雖降低AI訓練成本,但AI模型的低成本化可望擴大應用場景,進而增加全球數據中心建設量。光收發模塊作為數據中心互連的關鍵組件,將受惠于高速數據傳輸的需求,預測2023年400Gbps以上的光收發模塊全球出貨量為640萬個,2024年約2040萬個,預估至2025年將超過3190萬個,年增長率達56.5%。
AI芯片積極適配
對DeepSeek的認可不僅體現在排行榜和用戶下載量上,也反映在國際AI芯片巨頭的兼容和本土廠商的積極適配。
1月31日,英偉達發布搭載DeepSeekR1671b的“英偉達NIM微服務”預覽版,顯著提升AI模型的運行效率,簡化企業部署流程,降低AI落地的技術門檻。另外,AMD已將新的DeepSeek-V3模型集成到InstinctMI300XGPU上;英特爾也表示其開發的AI芯片/GPU芯片可以支持DeepSeek,有意與中國芯片合作打破英偉達打造的生態壟斷。
據業內分析,嚴格意義上,DeepSeek并未離開英偉達的CUDA超級“護城河”,而是使用了英偉達的PTX(Parallel Thread Execution)語言,實現在接近匯編語言的層級運行,通過允許進行細粒度的優化,能夠對GPU硬件進行更底層、更精準的控制,從而將英偉達H800GPU的性能發揮到極致,實現了傳統基于CUDA的方法難以達到的效率提升。
前述業內人士向記者表示,把CUDA生態繞過去并沒有必要性,只要使用英偉達GPU就會或多或少使用CUDA,但是能夠使用PTX證明DeepSeek有能力做到更底層的技術,本質上對國產GPU也是好事。有分析指出,通過精通運用PTX語言,有望幫助國產GPU進行針對性算子優化,提升模型在國產GPU上的運行效率。
除了國際巨頭,海光信息作為國產AI芯片企業,2月4日晚宣布成功完成DeepSeekV3和R1模型與海光AI加速卡DCU的適配并正式上線,有望推動AI技術在更多行業的落地與普及。2月5日,公司股價上漲11.19%。
另外,潞晨科技攜手華為昇騰,聯合發布基于昇騰算力的DeepSeekR1系列推理API,及云鏡像服務,實現了昇騰算力與DeepSeekR1系列模型的推理適配優化,性能表現與使用高端GPU持平。另外,DeepSeek系列模型正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署。
國產GPU廠商沐曦宣布與DeepSeek的合作,摩爾線程宣布部署DeepSeek蒸餾模型推理服務,提升了DeepSeek模型的計算效率和資源利用率;天數智芯宣布適配DeepSeekR1千問蒸餾模型,提供更高效、更穩定的推理服務,滿足了不同規模和需求的應用場景。
2月5日,壁仞科技宣布自主研發的壁礪TM系列產品完成對DeepSeekR1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級參數版本,包括LLaMA蒸餾模型和千問蒸餾模型,為開發者提供高性能、低成本的大模型部署與開發解決方案。
云廠商積極擴列
除了AI硬件端廠商,不少云計算巨頭也紛紛入圍DeepSeek“朋友圈”,華為云、騰訊云、阿里云、百度云等已經宣布支持部署DeepSeek模型。另外,聯通云宣布已基于星羅平臺實現國產及主流算力適配多規格DeepSeek-R1模型,兼顧私有化和公有化場景,提供全方位運行服務保障,為客戶帶來開箱即用的使用體驗;實現多產品場景調用,可在全國270多骨干云池預部署,全面接入聯通云桌面、編程助手等多產品場景;提供全方位安全服務保障,實時提供抗DDoS等三大安全服務并具備元景安全大模型加持。
除了云廠商,應用端廠商也在積極探索和部署DeepSeek模型。
2月4日,萬興科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入適配,旗下視頻創意、繪圖創意及文檔創意軟件業務產品,諸如萬興喵影、億圖圖示、億圖腦圖MindMaster、萬興PDF等均已融合DeepSeek-R1大模型相關能力,用戶可搶鮮體驗。接入DeepSeek-R1后,用戶使用產品的門檻降低,大模型應用的成本也進一步降低。
另外,北信源公眾號顯示,其自主研發的“密信AI能力平臺”第一時間完成了與DeepSeek的技術對接,這一舉措將為信源密信和第三方應用提供DeepSeek大模型AI能力;奇安信宣布已完成與DeepSeek全面深度接入,自研的QAX—GPT安全大模型通過DeepSeekR1優化和蒸餾后,運營成本大幅降低,在威脅研判等多場景下的性能顯著提升,安全專業問答整體性能分數提升約16%。
當虹科技官微顯示,公司BlackEye多模態視聽大模型正式融合DeepSeek-R1和DeepSeekJanusPro,并完成視聽傳媒、工業與衛星、車載智能座艙等多行業垂類場景的數據調優訓練,可為視聽傳媒、工業與衛星、車載智能座艙等行業客戶提供更低成本的大模型部署及全新的大模型體驗。
易點天下宣布,旗下KreadoAI、數眼智能、zMaticooADX等多款核心產品將融合DeepSeek-R1大模型相關能力,提升用戶智能營銷體驗。