版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

所有人都在討論的“DeepSeek”,究竟是啥?

科普熊貓
成都市科學(xué)技術(shù)協(xié)會官方科普號
收藏

當(dāng)?shù)貢r(shí)間1月27日,受中國人工智能初創(chuàng)公司——深度求索公司(DeepSeek)沖擊,美國人工智能主題股票遭拋售,美國芯片巨頭英偉達(dá)(NVIDIA)股價(jià)歷史性暴跌,納斯達(dá)克綜合指數(shù)大幅下跌。

市場分析認(rèn)為,此次美國股市震蕩的核心原因是DeepSeek的最新突破,動搖了美國科技行業(yè)的地位。2024年底,DeepSeek發(fā)布了新一代大語言模型V3,并宣布開源。測試結(jié)果顯示,該模型在多項(xiàng)評測中表現(xiàn)優(yōu)于主流開源模型,且具有成本優(yōu)勢。

本月,DeepSeek在世界經(jīng)濟(jì)論壇2025年年會開幕當(dāng)天發(fā)布了最新開源模型R1,再次引發(fā)全球關(guān)注。

據(jù)介紹,R1模型在技術(shù)上實(shí)現(xiàn)了重要突破——用純深度學(xué)習(xí)方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI的o1模型正式版,且訓(xùn)練成本僅為560萬美元,遠(yuǎn)低于美國科技巨頭的數(shù)億美元乃至數(shù)十億美元投入。

市場分析師認(rèn)為,DeepSeek的模型推出如同一顆“震撼彈”,令市場對美國科技行業(yè)的競爭力產(chǎn)生疑慮,導(dǎo)致人工智能主題股票遭拋售。

安內(nèi)克斯理財(cái)公司首席經(jīng)濟(jì)學(xué)家雅各布森表示,人們真正感到詫異的是,像英偉達(dá)這樣的公司,被認(rèn)為幾乎壟斷了人工智能生態(tài)系統(tǒng)中的所有芯片,但也許“護(hù)城河”并不像人們想象的那么強(qiáng)大,這可能是其股價(jià)下跌的原因。

目前,DeepSeek開發(fā)的移動應(yīng)用程序已超越OpenAI的ChatGPT,登頂蘋果手機(jī)應(yīng)用商店美國區(qū)免費(fèi)應(yīng)用榜單。

DeepSeek:性能卓越,用戶體驗(yàn)佳

DeepSeek是一款由國內(nèi)人工智能公司研發(fā)的大型語言模型,擁有強(qiáng)大的自然語言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問題。

與OpenAI開發(fā)的ChatGPT相比,DeepSeek不僅率先實(shí)現(xiàn)了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達(dá)到了GPT-o1級別的表現(xiàn),引發(fā)海外AI圈的廣泛討論。

北京郵電大學(xué)人工智能學(xué)院人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉介紹,DeepSeek最大的優(yōu)勢在于算法的改進(jìn)和優(yōu)化,節(jié)省了算力和數(shù)據(jù)量。以前如果說OpenAI是“大力出奇跡”,如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創(chuàng)造奇跡。

南京大學(xué)人工智能學(xué)院教授俞揚(yáng)表示,DeepSeek在算法上進(jìn)行了相應(yīng)的優(yōu)化,使得訓(xùn)練成本大幅降低。

開源:未來的發(fā)展方向?

DeepSeek采用了完全開源策略,不僅降低了用戶的使用門檻,還促進(jìn)了AI開發(fā)者社區(qū)的協(xié)作生態(tài)。通過開源,DeepSeek吸引了大量開發(fā)者和研究人員的關(guān)注,推動了AI技術(shù)的發(fā)展。英偉達(dá)AI科學(xué)家Jim Fan稱贊DeepSeek是“真正開放的前沿研究,賦能所有人”。

當(dāng)然,開源也面臨著保護(hù)知識產(chǎn)權(quán)和開源社區(qū)秩序維護(hù)等挑戰(zhàn)。

俞揚(yáng)表示,開源只是一種商業(yè)模式,即便開源項(xiàng)目也擁有版權(quán)。開源與閉源之爭,實(shí)質(zhì)上是不同商業(yè)模式在特定場景和時(shí)代背景下的有效性對比。

DeepSeek的成功被一些人視為中國技術(shù)理想主義的體現(xiàn),甚至被外國人比喻為神秘的東方力量。

但從整個(gè)AI大模型產(chǎn)業(yè)來看,DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過算法優(yōu)化而非單純依賴算力和數(shù)據(jù)量來提升模型性能。這一方向也為AI大模型產(chǎn)業(yè)的發(fā)展提供了新的思路。

評論
通遼市科爾沁區(qū)科爾沁街道民航社區(qū)
大學(xué)士級
了解
2025-02-25
科普ZSL
少傅級
已閱讀
2025-02-03
叔叔的小懶豬
太師級
DeepSeek:性能卓越,用戶體驗(yàn)佳
2025-02-02