版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

DeepSeek熱度正盛,被神話還是確有實力?

重慶市科學(xué)技術(shù)協(xié)會
原創(chuàng)
重慶市科學(xué)技術(shù)協(xié)會傾力打造的科普資源共享平臺。
收藏

2025年年初,中國初創(chuàng)公司DeepSeek以一種近乎現(xiàn)象級的速度崛起,引發(fā)了全球科技界的熱議。其模型在蘋果應(yīng)用商店的下載量超越ChatGPT、訓(xùn)練成本僅為競爭對手的零頭、技術(shù)能力被冠以“顛覆性”標簽……這些標簽讓DeepSeek迅速成為輿論焦點。

然而,在鋪天蓋地的贊譽與爭議中,一個核心問題亟待回答:DeepSeek的“神話”究竟是資本市場的造勢,還是AI實力的真實體現(xiàn)?

技術(shù)突破:低成本與高性能的雙重革命

實際上,DeepSeek的崛起并非偶然,其核心在于通過工程化能力與創(chuàng)新,實現(xiàn)了降本增效。其技術(shù)路徑圍繞高效架構(gòu)設(shè)計、算法優(yōu)化與資源管理展開。例如,采用專家混合架構(gòu)(MoE)將任務(wù)分解為子任務(wù)并行處理,顯著提升推理效率;通過持續(xù)迭代優(yōu)化模型參數(shù),實現(xiàn)性能躍遷的同時降低算力消耗。此外,DeepSeek采用多云架構(gòu)動態(tài)分配算力資源,結(jié)合精細化成本控制策略,從硬件采購到能耗管理全面壓縮開支。

以DeepSeek-V3為例,作為一款集成6710億參數(shù)的專家混合模型(MoE),DeepSeek-V3擁有6710億參數(shù),每個token激活370億參數(shù),能夠處理復(fù)雜的編程、數(shù)學(xué)和推理任務(wù)。在多語言編程測試排行榜中,DeepSeek V3超越了Anthropic的Claude 3.5 Sonnet大模型,僅次于OpenAI o1大模型。特別是在數(shù)學(xué)與代碼能力方面表現(xiàn)突出,DeepSeek V3在MATH-500測試中,準確率達90.2%,遠超GPT-4o(74.6%)和Llama 3.1(73.8%)。

在訓(xùn)練成本方面,DeepSeek-V3僅使用了2048個H800 GPU,總訓(xùn)練GPU卡時為2788千小時,平均到每個GPU 上,僅為1361小時,約合56.7天。與之對比,GPT-4 MoE使用8000個H100訓(xùn)練了90天,合計約為17280千卡時,相當于DeepSeek-V3的6.2倍。

不僅如此,這種低成本高產(chǎn)出的技術(shù)路線,不僅降低了對高端GPU的依賴程度,還能夠與國產(chǎn)芯片架構(gòu)完美適配,助力國產(chǎn)芯片產(chǎn)業(yè)的發(fā)展。

生態(tài)重構(gòu):推動國產(chǎn)算力生態(tài)繁榮發(fā)展

正如上文所提到的那樣,DeepSeek的熱度不僅源于技術(shù)突破,更為關(guān)鍵的是其對國產(chǎn)算力生態(tài)所起到的催化作用。

具體而言,從芯片層面來看,華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光信息、壁仞科技、燧原科技等國產(chǎn)芯片廠商宣布適配DeepSeek大模型服務(wù)。

另外,從云服務(wù)層面來看,華為云、騰訊云、阿里云、百度云等國內(nèi)云廠商均在其云服務(wù)平臺上線了DeepSeek大模型。

可以說,DeepSeek與芯片廠商及云服務(wù)廠商的緊密合作,形成了強大的產(chǎn)業(yè)協(xié)同效應(yīng),有力推動了國產(chǎn)算力生態(tài)的繁榮發(fā)展,為AI技術(shù)的廣泛應(yīng)用和普及奠定了基礎(chǔ)。

值得一提的是,在各行業(yè)的應(yīng)用中,DeepSeek也取得了顯著進展。其中,在金融領(lǐng)域,已有超過30家券商、基金、銀行等機構(gòu)接入DeepSeek,為金融業(yè)務(wù)的創(chuàng)新和發(fā)展提供了技術(shù)支持。在消費電子領(lǐng)域,華為、榮耀、OPPO、星際魅族、努比亞、vivo等國產(chǎn)手機品牌宣布接入DeepSeek模型,將為用戶帶來更智能的使用體驗。在汽車領(lǐng)域,吉利汽車、東風(fēng)汽車、智己汽車、長城汽車、廣汽、北汽、奇瑞集團、零跑汽車、比亞迪、一汽集團、長安汽車等超過20家汽車品牌或汽車集團接入DeepSeek,助力汽車智能化水平的提升。在家電領(lǐng)域,海爾、海信視像、長虹等多家企業(yè)也接入了 DeepSeek,為家電產(chǎn)品的智能化升級注入了動力。

爭議焦點:服務(wù)器穩(wěn)定性與產(chǎn)****業(yè)閉環(huán)

盡管DeepSeek展現(xiàn)出技術(shù)突破與生態(tài)整合的潛力,但其發(fā)展路徑仍面臨多重挑戰(zhàn)。首當其沖的是算力需求與供給的失衡,盡管采用多云架構(gòu)動態(tài)分配資源,但推理階段算力需求的爆炸性增長導(dǎo)致服務(wù)器頻繁過載,用戶常遭遇服務(wù)器繁忙的提示。

其次,技術(shù)閉環(huán)尚未完全實現(xiàn):盡管官方宣稱模型與國產(chǎn)芯片高度適配,但實際訓(xùn)練仍依賴英偉達英偉達GPU系列芯片,國產(chǎn)芯片更多承擔(dān)推理任務(wù),尚未形成“訓(xùn)練-推理-優(yōu)化”全鏈條閉環(huán)。

由此可見,DeepSeek需要進一步完善其技術(shù)生態(tài),降低對外部技術(shù)的依賴,提高國產(chǎn)技術(shù)的自主可控性。

寫在最后:

未來,DeepSeek能否從“現(xiàn)象級產(chǎn)品”升級為全球AI生態(tài)的核心參與者,將取決于其技術(shù)自主性與生態(tài)閉環(huán)的完善程度。具體包括:一是技術(shù)路徑的持續(xù)優(yōu)化:進一步提升模型效率、降低算力依賴,并推動國產(chǎn)芯片在訓(xùn)練環(huán)節(jié)的應(yīng)用;二是生態(tài)協(xié)同的深化:強化與芯片、云服務(wù)、終端廠商的協(xié)作,構(gòu)建從硬件到應(yīng)用的完整產(chǎn)業(yè)鏈;三是商業(yè)場景的深度融合:結(jié)合金融、汽車、消費電子等垂直領(lǐng)域需求,探索可持續(xù)的商業(yè)模式;四是政策與人才支持:依托國內(nèi)新質(zhì)生產(chǎn)力發(fā)展戰(zhàn)略,吸引頂尖人才并完善AI倫理與安全框架。

供稿單位:重慶天極網(wǎng)絡(luò)有限公司

審核專家:李志高

聲明:除原創(chuàng)內(nèi)容及特別說明之外,部分圖片來源網(wǎng)絡(luò),非商業(yè)用途,僅作為科普傳播素材,版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系刪除。

內(nèi)容資源由項目單位提供

評論
科普中國俄體鎮(zhèn)023
太師級
2025-02-28