版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

DeepSeek(深度求索)爆火背后那只“平凡的小豬”

我是科學(xué)人
傳承科學(xué)精神,汲取榜樣力量
收藏

這個春節(jié),DeepSeek(深度求索)火了。

火到什么程度?大街小巷,從科技愛好者到普通民眾,都在談?wù)揇eepSeek。社交媒體上,網(wǎng)友紛紛曬出與DeepSeek的互動對話,從點(diǎn)評學(xué)校到銳評手機(jī)廠商的優(yōu)缺點(diǎn),萬物皆可“DeepSeek”。超60%的用戶用它制定旅行攻略、翻譯外語、學(xué)習(xí)方言,約40%的用戶用它學(xué)習(xí)麻將規(guī)則,為春節(jié)增添了不少樂趣……在資本市場,券商們也在為DeepSeek“加班加點(diǎn)”,舉辦超60場路演,甚至除夕夜也未停歇。憑借高性價(jià)比和開源創(chuàng)新,DeepSeek部分指標(biāo)超越ChatGPT等國際巨頭,被海外稱為“來自東方的神秘力量”。

十年寒窗無人問,一舉成名天下聞。亦如DeepSeek的成名之路,它的創(chuàng)始人梁文峰也在這個春節(jié)成為“最火的咖”“最靚的仔”——獲總理邀請參加座談會,登上《新聞聯(lián)播》;家鄉(xiāng)父老拉橫幅、立拱門歡迎他回鄉(xiāng)……熱鬧喧囂背后,讓我們走進(jìn)梁文峰的成長史。

2019年,梁文鋒在金牛獎頒獎儀式上

從農(nóng)村到浙大

1985年,梁文峰出生于廣東湛江吳川的一個普通農(nóng)村家庭。他的父母都是小學(xué)教師,家境并不富裕。然而,梁文峰從小就展現(xiàn)出對數(shù)學(xué)和科技的濃厚興趣,在奧數(shù)競賽中屢獲佳績,成為眾人眼中的“天才少年”。2002年,他以吳川市第一中學(xué)高考狀元的身份,考入浙江大學(xué)電子信息工程專業(yè)人工智能方向。大學(xué)期間,他不僅對計(jì)算機(jī)科學(xué)和數(shù)學(xué)保持著濃厚興趣,常常泡在實(shí)驗(yàn)室研究機(jī)器視覺,還自費(fèi)購買零件組裝設(shè)備,不斷提升自己的實(shí)踐能力。本科畢業(yè)后,梁文峰選擇繼續(xù)深造,于2007年在浙江大學(xué)攻讀信息與通信工程碩士學(xué)位,他的畢業(yè)論文聚焦于低成本攝像機(jī)的算法優(yōu)化。此時的他已經(jīng)堅(jiān)信人工智能將是未來的發(fā)展方向,在學(xué)術(shù)研究的道路上不斷深耕。

2008年,全球金融危機(jī)爆發(fā),金融市場動蕩不安,但梁文峰卻獨(dú)具慧眼,敏銳地捕捉到了機(jī)器學(xué)習(xí)技術(shù)在量化交易中的巨大潛力。他和團(tuán)隊(duì)開始積累市場行情數(shù)據(jù)、金融市場相關(guān)數(shù)據(jù)及宏觀經(jīng)濟(jì)數(shù)據(jù),探索使用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行全自動量化交易。這段經(jīng)歷不僅為他日后的職業(yè)生涯奠定了堅(jiān)實(shí)的基礎(chǔ),也讓他對金融市場和人工智能技術(shù)的結(jié)合有了更深刻的理解。

投身量化完成原始積累

2013年,碩士畢業(yè)后的梁文峰即開啟了創(chuàng)業(yè)之旅。他與同學(xué)先是創(chuàng)立了杭州雅克比投資管理有限公司,正式投身量化投資領(lǐng)域。2015年,他們又創(chuàng)辦了幻方量化(后更名為浙江九章資產(chǎn)管理有限公司),并開始在量化投資領(lǐng)域嶄露頭角。

幻方量化憑借數(shù)字和人工智能技術(shù),迅速在量化投資領(lǐng)域取得了顯著成績。2016年,公司推出第一個AI模型,實(shí)現(xiàn)了所有量化策略的AI化轉(zhuǎn)型。通過分析海量數(shù)據(jù),幻方量化在動蕩的市場中逆勢擴(kuò)張,管理資金規(guī)模逐步擴(kuò)大。到2018年,幻方量化正式確立了AI為核心的發(fā)展戰(zhàn)略,進(jìn)一步深化AI技術(shù)在量化投資中的應(yīng)用。到2019年,幻方量化管理的資金規(guī)模突破百億元,成為中國最大的量化基金之一。

當(dāng)多數(shù)人尚未意識到算力的重要性時,梁文峰便展現(xiàn)出了他的前瞻性眼光。他斥資2億元創(chuàng)辦幻方AI公司,研發(fā)“螢火一號”訓(xùn)練平臺,搭載1100塊GPU顯卡,于2020年投入使用,顯著提升算力水平。2021年,他又投入10億元建設(shè)“螢火二號”,配備萬張英偉達(dá)A100顯卡,進(jìn)一步鞏固領(lǐng)先地位。憑借強(qiáng)大技術(shù)實(shí)力與創(chuàng)新精神,幻方迅速成長為國內(nèi)領(lǐng)先的量化私募基金,管理規(guī)模突破千億,躋身亞洲最大量化基金之一,成為國內(nèi)量化私募“四大天王”之一。

DeepSeek的“不尋常之路”

然而,梁文峰的雄心遠(yuǎn)不止于此。在量化投資領(lǐng)域取得巨大成功后,他將目光投向了更具挑戰(zhàn)性的通用人工智能(AGI)領(lǐng)域。2023年5月,梁文峰宣布進(jìn)軍AGI,同年7月創(chuàng)辦了杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek),正式開啟了他在AI大模型研發(fā)領(lǐng)域的新篇章。

與其他致力于快速商業(yè)化的中國AI公司不同,DeepSeek專注于“不走尋常路”。他們的目標(biāo)不是復(fù)刻ChatGPT,而是研究和揭秘AGI的更多未知信息。DeepSeek的故事也就開始于這一刻。

DeepSeek成立后,梁文峰帶領(lǐng)團(tuán)隊(duì)攻堅(jiān)克難,不斷取得技術(shù)突破。2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2,以高性價(jià)比和創(chuàng)新架構(gòu)引發(fā)行業(yè)關(guān)注。同年末,DeepSeek-V3問世,該模型采用創(chuàng)新的MLA架構(gòu)(多頭潛在注意力機(jī)制)與MoE稀疏結(jié)構(gòu),僅用2000塊H800芯片、557萬美元成本完成訓(xùn)練,性能卻比肩GPT-4o,其長文本處理能力擴(kuò)展至128k上下文,推理速度提升至每秒60個token。2025年年初,DeepSeek發(fā)布的R1模型,更是在數(shù)學(xué)、代碼、推理等方面比肩OpenAI的頂尖模型,且開源權(quán)重,降低了AI技術(shù)的門檻,其免費(fèi)聊天機(jī)器人應(yīng)用在美國和其他國家的iOS應(yīng)用商店下載量飆升,甚至超越ChatGPT,登上免費(fèi)應(yīng)用榜單第一位。

一個80后程序員在攪動中國量化市場完成資金積累后,似乎帶領(lǐng)他的團(tuán)隊(duì)又回到了原本鐘情的AI起點(diǎn),但產(chǎn)生的能量正在全球掀起駭浪。深究原因,除了創(chuàng)新第一性原則、革命性架構(gòu)、致力于開源等明晰的路線之外,獨(dú)特的公司文化和人才戰(zhàn)略也為其提供了獨(dú)特的沃土——DeepSeek始終保持著一個完全自下而上的組織結(jié)構(gòu),優(yōu)先看創(chuàng)造熱情而不是證書。他們的突破性創(chuàng)新來自年輕的本土人才——中國本土的應(yīng)屆畢業(yè)生和年輕技術(shù)人才,而非海外招聘。

值得一提的是,梁文峰創(chuàng)立的公司一直熱衷于公益事業(yè),官網(wǎng)披露公司員工“一只平凡的小豬”個人捐助1.38億元,在全國范圍內(nèi)幫助弱勢群體。這位神秘的“小豬”,有爆料稱正是梁文峰本人。

評論
科普ZSL
少傅級
十年寒窗無人問,一舉成名天下聞。亦如DeepSeek的成名之路
2025-03-04
飛馬騰空
大學(xué)士級
閱讀理解
2025-02-08
規(guī)劃科普1985
少師級
十年寒窗無人問,一舉成名天下聞。亦如DeepSeek的成名之路
2025-02-07