2月24日,DeepSeek啟動(dòng)“開源周”,開源了首個(gè)代碼庫FlashMLA。
據(jù)介紹,這是DeepSeek針對(duì)Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,專為處理可變長(zhǎng)度序列而設(shè)計(jì),現(xiàn)在已經(jīng)投入生產(chǎn)使用?!霸贖800上能實(shí)現(xiàn)3000 GB/s的內(nèi)存帶寬&580 TFLOPS的計(jì)算性能。”DeepSeek說。簡(jiǎn)單來說,**FlashMLA 是一個(gè)能讓大語言模型在 H800這樣的GPU上跑得更快、更高效的優(yōu)化方案,尤其適用于高性能AI任務(wù)。**這一代碼能夠加速大語言模型的解碼過程,從而提高模型的響應(yīng)速度和吞吐量,這****對(duì)于實(shí)時(shí)生成任務(wù)(如聊天機(jī)器人、文本生成等)尤為重要。
MLA (Multi-Layer Attention,多層注意力機(jī)制)是一種改進(jìn)的注意力機(jī)制,旨在提高Transformer模型在處理長(zhǎng)序列時(shí)的效率和性能?。MLA通過多個(gè)頭(head)的并行計(jì)算,讓模型能夠同時(shí)關(guān)注文本中不同位置和不同語義層面的信息,從而更全面、更深入地捕捉長(zhǎng)距離依賴關(guān)系和復(fù)雜語義結(jié)構(gòu)?。此前,有從業(yè)者解析DeepSeek架構(gòu)時(shí)提到,MLA的本質(zhì)是對(duì)KV(Key-Value,一種緩存機(jī)制)的有損壓縮,提高存儲(chǔ)信息,“該技術(shù)首次在DeepSeek-V2中引入,MLA是目前開源模型里顯著減小KV 緩存大小的最佳方法?!盌eepSeek開源這一代碼有何影響?媒體用這一問題詢問了DeepSeek,它回答稱:這一代碼就像給AI推理引擎裝上了一臺(tái)“渦輪增壓器”,讓大模型在處理復(fù)雜任務(wù)時(shí)更快、更省資源,同時(shí)降低了技術(shù)門檻。FlashMLA的意義不單是技術(shù)優(yōu)化,更是打破算力壟斷、加速AI普惠的關(guān)鍵一步。具體來說,**FlashMLA可以突破GPU算力瓶頸,降低成本。**傳統(tǒng)解碼方法在處理不同長(zhǎng)度的序列(如翻譯不同長(zhǎng)度的句子)時(shí),GPU的并行計(jì)算能力會(huì)被浪費(fèi),就像用卡車運(yùn)小包裹,大部分空間閑置。而FlashMLA的改進(jìn)是:通過動(dòng)態(tài)調(diào)度和內(nèi)存優(yōu)化,讓Hopper GPU(如H100)的算力被“榨干”,相同硬件下吞吐量顯著提升。這意味著企業(yè)可以用更少的GPU服務(wù)器完成同樣的任務(wù),直接降低推理成本。**另一方面,F(xiàn)lashMLA可以推動(dòng)大模型落地應(yīng)用。**可變長(zhǎng)度序列是現(xiàn)實(shí)場(chǎng)景中的常態(tài)(如聊天對(duì)話、文檔生成),但傳統(tǒng)方法需要填充(Padding)到固定長(zhǎng)度,導(dǎo)致計(jì)算冗余。FlashMLA支持動(dòng)態(tài)處理變長(zhǎng)輸入,讓AI應(yīng)用(如客服機(jī)器人、代碼生成)響應(yīng)更快、更流暢,用戶體驗(yàn)提升,加速商業(yè)化落地。此前高效解碼內(nèi)核多由科技巨頭閉源壟斷(如CUDA優(yōu)化庫),中小企業(yè)和研究者難以復(fù)現(xiàn)。FlashMLA開源后,開發(fā)者可免費(fèi)獲得“工業(yè)級(jí)優(yōu)化方案”,降低技術(shù)門檻,促進(jìn)更多創(chuàng)新應(yīng)用(如垂直領(lǐng)域小模型)的誕生。"the whale is making waves!(鯨魚正在掀起波浪!)”有網(wǎng)友在DeepSeek的帖子下留言稱(注:鯨魚是DeepSeek的企業(yè)LOGO)。也有網(wǎng)友希望DeepSeek開源網(wǎng)頁搜索(Web Search)相關(guān)的代碼,并提到,“DeepSeek 是真正的OpenAI(開放人工智能)?!?strong>這僅僅是開始,上周DeepSeek宣布,這周會(huì)陸續(xù)開源5個(gè)代碼庫,“以完全透明的方式分享我們微小但真誠的進(jìn)展”。DeepSeek表示,這些在線服務(wù)中的基礎(chǔ)構(gòu)建模塊已經(jīng)經(jīng)過文檔化、部署,并在生產(chǎn)環(huán)境中經(jīng)過實(shí)戰(zhàn)檢驗(yàn)。無獨(dú)有偶,在世界互聯(lián)網(wǎng)大會(huì)人工智能專業(yè)委員會(huì)(以下簡(jiǎn)稱“專委會(huì)”)近日主辦的“人工智能賦能科學(xué)研究”研討會(huì)上,專委會(huì)首席主任委員、中國工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)表示,在開放科學(xué)領(lǐng)域,互聯(lián)網(wǎng)發(fā)揮著重要作用,他認(rèn)為AI for Science(AI用于科研)將幫助更多人加入創(chuàng)新陣列。開放科學(xué)并非簡(jiǎn)單地將原有科學(xué)成果開放,而是對(duì)原有科學(xué)體系的重新審視。談及開放科學(xué),王堅(jiān)認(rèn)為,開放科學(xué)不是簡(jiǎn)單地把科學(xué)開放出來,而是要考慮怎么做科學(xué)研究,怎么做交流。**在開放科學(xué)領(lǐng)域,互聯(lián)網(wǎng)發(fā)揮著重要作用,也影響著人工智能的發(fā)展。**如今,數(shù)據(jù)、計(jì)算和人工智能都無法脫離互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)作為基礎(chǔ)設(shè)施,將所有問題向前推進(jìn)。人工智能簡(jiǎn)單來說是數(shù)據(jù)、模型和計(jì)算的結(jié)合,與互聯(lián)網(wǎng)一樣具有規(guī)模效應(yīng)。**開源的概念也在不斷演變。**王堅(jiān)提及,在人工智能和數(shù)據(jù)時(shí)代,開源不能僅用Open Source Code表達(dá),創(chuàng)新的特點(diǎn)應(yīng)是Open Resource(開放資源)。“開源是對(duì)社會(huì)的貢獻(xiàn),是對(duì)全世界的貢獻(xiàn)?!?img src="https://pqnoss.kepuchina.cn/kepuyun/2025/02/26/11/1740450127784.jpg" alt="" />
談及DeepSeek對(duì)于開源概念的拓展和開放資源,對(duì)于科學(xué)技術(shù)領(lǐng)域的巨大價(jià)值,會(huì)上,王堅(jiān)表示,“我自己也覺得,這次DeepSeek給大家的感受,給我在過去兩年一直講的開源一次非常好的驗(yàn)證?!彼峒埃珼eepSeek基于MIT許可協(xié)議開源,當(dāng)DeepSeek出來的時(shí)候,《自然》雜志在一個(gè)星期以內(nèi)發(fā)表了五篇文章講這件事情。其中有一篇,很認(rèn)真地探討了DeepSeek等對(duì)科學(xué)的研究有沒有推動(dòng)作用。當(dāng)數(shù)學(xué)、人工智能與基礎(chǔ)設(shè)施相結(jié)合,將形成面向全球的公共產(chǎn)品,促進(jìn)科研資源公平分配,激發(fā)個(gè)人創(chuàng)造力,推動(dòng)科技創(chuàng)新,實(shí)現(xiàn)開放資源整合,避免科技創(chuàng)新資源被少數(shù)人壟斷?!八晕蚁嘈牛绻覀兡軌虬堰@樣一個(gè)技術(shù)用好,再也沒有人可以把真正的科技創(chuàng)新資源放在一個(gè)非常小的圈子,這可能也是這件事情的意義以及它的價(jià)值所在?!蓖鯃?jiān)說。(來源:第一財(cái)經(jīng)、之江實(shí)驗(yàn)室)