久久99国产综合精品无码免费 ,99久久免费看国产精品,亚洲欧洲日产国产av无码

DeepSeek公司背景與發(fā)展

DeepSeek于2023年成立，其母公司幻方量化在量化投資領(lǐng)域成績(jī)斐然，是國(guó)內(nèi)頂尖的量化投資公司，管理規(guī)模曾一度突破千億大關(guān)。2020年3月，幻方量化建立螢火一號(hào)算力集群，緊接著在2021年建立螢火二號(hào)，二者共同構(gòu)成了當(dāng)時(shí)亞洲規(guī)模最大的私有化AI算力池，擁有近萬張A100 卡。當(dāng)時(shí)，幻方量化出于自身量化投資對(duì)算力的需求建立此算力池，同時(shí)面向公眾開放使用。這一舉措為后來大模型的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)，也展現(xiàn)了幻方量化在技術(shù)布局上的前瞻性。

DeepSeek模型發(fā)展歷程

DeepSeek在模型研發(fā)上穩(wěn)步推進(jìn)，2024年初推出首個(gè)大模型版本，起初在行業(yè)內(nèi)并未引起較大轟動(dòng)。然而，2024年5月推出的V2版本開始嶄露頭角，性能對(duì)標(biāo)GPT-4，而價(jià)格僅為GPT-4的百分之一。在國(guó)外學(xué)術(shù)圈和工業(yè)圈，它早早受到關(guān)注，特別是在代碼開發(fā)領(lǐng)域表現(xiàn)突出，成為國(guó)外眾多AI Coding軟件中唯一集成的國(guó)產(chǎn)大模型。去年年底推出的V3和R1版本更是引起了國(guó)內(nèi)外的廣泛關(guān)注，其模型性能對(duì)標(biāo)國(guó)外最頂尖的OpenAI-o1模型，充分展示了DeepSeek在技術(shù)研發(fā)上的實(shí)力。

DeepSeek技術(shù)優(yōu)勢(shì)剖析

基于強(qiáng)化學(xué)習(xí)的訓(xùn)練方式

DeepSeek-R1的Zero版本基于大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練，拋棄了傳統(tǒng)的基于人類標(biāo)注反饋數(shù)據(jù)訓(xùn)練的獎(jiǎng)勵(lì)模型，選擇了客觀評(píng)價(jià)指標(biāo)作為獎(jiǎng)勵(lì)模型。這種獎(jiǎng)勵(lì)模型主要基于兩個(gè)核心要點(diǎn)：一是回答的答案是否準(zhǔn)確，即是否可通過計(jì)算規(guī)則進(jìn)行檢驗(yàn)；二是答案格式是否符合要求，即是否包含了思考的過程。以回答數(shù)學(xué)問題為例，若模型簡(jiǎn)單回答正確記1分，若通過邏輯推理得出正確答案則記2分，答案錯(cuò)誤記0分；在代碼生成任務(wù)中，通過編譯器運(yùn)行結(jié)果判斷，符合預(yù)期記1分，編譯失敗或結(jié)果錯(cuò)誤記0分，有思考過程會(huì)額外加分。與傳統(tǒng)依賴人類標(biāo)注的方式相比，DeepSeek的評(píng)價(jià)方式更加客觀，有效避免了人類標(biāo)注存在的效率和準(zhǔn)確率問題，同時(shí)也規(guī)避了人工反饋帶來的主觀和價(jià)值觀因素影響。

創(chuàng)新的模型架構(gòu)

在模型架構(gòu)方面，DeepSeek有諸多創(chuàng)新。DeepSeek采取目前流行的混合專家（MoE）架構(gòu)，MoE借鑒了人類大腦的工作原理。大腦的不同區(qū)域負(fù)責(zé)不同功能，如前額葉負(fù)責(zé)邏輯推理，顳葉中的梭狀回面孔區(qū)負(fù)責(zé)人臉識(shí)別、而海馬體負(fù)責(zé)記憶等。MoE架構(gòu)下參數(shù)量雖大，但特定任務(wù)僅由特定的一小部分參數(shù)處理，這極大地降低了計(jì)算消耗，同時(shí)也便于對(duì)參數(shù)權(quán)重進(jìn)行定向優(yōu)化。此外，DeepSeek自主創(chuàng)新的MLA模型通過算法調(diào)整，減少了推理過程的KV Cache，降低了顯存消耗，進(jìn)而提高了推理效率。這兩種架構(gòu)的結(jié)合，為DeepSeek的高性能表現(xiàn)提供了有力支持。

軟硬件協(xié)同優(yōu)化策略

雖然DeepSeek很早就建設(shè)了萬卡集群，但是與國(guó)外同行相比，規(guī)模依然不足。面對(duì)算力資源的限制，DeepSeek采用了精細(xì)的調(diào)度算法，壓榨硬件的每一分算力。傳統(tǒng)方式在訓(xùn)練時(shí)，參數(shù)權(quán)重更新需一層一層按順序處理，存在排隊(duì)等待的情況，導(dǎo)致算力利用率不高。而DeepSeek的DualPipe調(diào)度算法類似于流程優(yōu)化，通過合理安排前向過程、后向過程以及層間通訊，使有前后依賴的任務(wù)緊密協(xié)作，從而在最短時(shí)間內(nèi)完成一輪迭代訓(xùn)練。這種軟硬件協(xié)同的方式，在國(guó)產(chǎn)GPU算力與英偉達(dá)GPU存在差距的情況下，通過軟件優(yōu)化彌補(bǔ)了硬件的不足，為AI產(chǎn)業(yè)的發(fā)展開辟了新的路徑。

DeepSeek的特點(diǎn)

DeepSeek的以下幾個(gè)特點(diǎn)，使其成為獨(dú)樹一幟的標(biāo)桿。

首先，其訓(xùn)練成本大幅下降，外媒報(bào)道僅需幾百萬美元，與之前動(dòng)輒上億的訓(xùn)練成本相比成本顯著降低。同時(shí)，通過蒸餾DeepSeek生成高質(zhì)量的推理數(shù)據(jù)，再利用這些數(shù)據(jù)微調(diào)像千問、Llama等開源小模型，用極低成本大幅提升了這些小模型的性能。

其次，DeepSeek將最大規(guī)模的671B模型參數(shù)完全公開，且開源協(xié)議非常寬松，允許自由修改、復(fù)制和商業(yè)化，這消除了企業(yè)在數(shù)據(jù)安全方面的顧慮，使企業(yè)能夠放心地在自己的環(huán)境內(nèi)部署私有化版本，將企業(yè)內(nèi)部的文檔、技術(shù)資料甚至財(cái)務(wù)數(shù)據(jù)用于大模型的問答和應(yīng)用，掃除了大模型應(yīng)用的最大障礙。

因此，DeepSeek徹底顛覆了AI產(chǎn)業(yè)原有的商業(yè)模式，原來通過商用模型部署的業(yè)務(wù)模式因DeepSeek的出現(xiàn)而發(fā)生巨大改變。

DeepSeek使用經(jīng)驗(yàn)分享

訪問與替代方案

目前，DeepSeek提供了官網(wǎng)和APP供用戶使用，但是因用戶量爆棚，在使用時(shí)可能會(huì)出現(xiàn)不穩(wěn)定的情況。在這種情況下，有一些替代方案可供選擇，如騰訊元寶和納米搜索等。這些平臺(tái)支持全尺寸模型的問答功能，還具備聯(lián)網(wǎng)搜索和文件上傳等功能，在DeepSeek官網(wǎng)不穩(wěn)定時(shí)能為用戶提供備用方案。

使用技巧與注意事項(xiàng)

使用DeepSeek時(shí)，打開“深度思考”開關(guān)至關(guān)重要，因?yàn)樵撻_關(guān)關(guān)閉時(shí)使用的是V3非推理模型，而打開后則調(diào)用R1推理模型，能獲得更強(qiáng)大的功能。在提問方式上，相比以往復(fù)雜的提示詞工程，DeepSeek推薦使用更自然的表達(dá)方式。用戶只需專注描述問題的背景信息、明確自己的目標(biāo)以及添加風(fēng)格提示等，例如要求“面向初中生以魯迅風(fēng)格寫一篇食品類科普文章”。此外，強(qiáng)烈推薦用戶閱讀清華大學(xué)出版的關(guān)于DeepSeek使用介紹的 PPT，其中詳細(xì)介紹了向DeepSeek提問的技巧，有助于用戶更好地與模型進(jìn)行交互。

如何將DeepSeek用于科普創(chuàng)作？

科普主題發(fā)掘

DeepSeek在科普主題發(fā)掘方面具有很大的潛力。它可以在特定領(lǐng)域，如前沿科技、城市生活常識(shí)、當(dāng)下流行的偽科學(xué)等方向，為創(chuàng)作者提供科普主題。同時(shí)，還能根據(jù)不同的受眾群體，生成相應(yīng)的主題。例如，針對(duì)60~70歲的老人，DeepSeek會(huì)提供圍繞健康管理方面的三高管理、科學(xué)飲食，以及退休后的心理健康指南等主題；而針對(duì)青少年破除偽科學(xué)的需求，DeepSeek會(huì)提供星座算命、手機(jī)致癌、外星人綁架等新奇有趣的主題。此外，結(jié)合近期熱點(diǎn)新聞，DeepSeek能從熱點(diǎn)話題中篩選出有價(jià)值的科普主題，如根據(jù)近期小行星撞地球的熱點(diǎn)話題，為科普創(chuàng)作提供靈感。

科普內(nèi)容生成

基于給定的科普主題，DeepSeek能夠?yàn)椴煌鼙娚舍槍?duì)性的科普內(nèi)容。以人造太陽的科普為例，當(dāng)要求為小學(xué)三年級(jí)學(xué)生創(chuàng)作科普文章時(shí)，它會(huì)避免使用專業(yè)術(shù)語，盡量用淺顯易懂的語言描述人造太陽的價(jià)值和功能；而當(dāng)為高中三年級(jí)學(xué)生創(chuàng)作時(shí)，則會(huì)包含科學(xué)專業(yè)術(shù)語和相關(guān)數(shù)據(jù)，適合高中學(xué)生作為課外拓展閱讀。DeepSeek還可以生成短視頻腳本，為科普短視頻的制作提供便利。同時(shí)，在科普分級(jí)讀物方面，它具有生成不同難度文章的能力，通過難度設(shè)定可以精確匹配不同閱讀水平的需求，這對(duì)于中文科普分級(jí)讀物的發(fā)展具有重要意義。

此外，在科普訪談方面，DeepSeek可以根據(jù)訪談對(duì)象和主題，結(jié)合互聯(lián)網(wǎng)上的相關(guān)材料，生成定制化的訪談提綱。訪談結(jié)束后，還能根據(jù)訪談文字稿輔助生成總結(jié)文章，提高工作效率。在處理國(guó)外前沿論文時(shí)，DeepSeek可以將論文內(nèi)容轉(zhuǎn)化為有趣的科普文章，在內(nèi)容風(fēng)格上并非機(jī)械解讀，而是結(jié)合科普宣傳的需求，吸引讀者的注意力。

拓展應(yīng)用場(chǎng)景

DeepSeek結(jié)合其他技術(shù)，能夠拓展科普內(nèi)容創(chuàng)作的邊界。例如，結(jié)合簡(jiǎn)易AI自動(dòng)化匹配視頻素材并進(jìn)行剪輯，再結(jié)合文本生成語音（TTS）技術(shù)，可以制作完整的科普短視頻；結(jié)合豆包進(jìn)行文本生成，實(shí)現(xiàn)圖文混排，使科普內(nèi)容更具吸引力；結(jié)合Kimi等相關(guān)工具可以制作科普PPT，用于展示科普知識(shí)；結(jié)合數(shù)字人技術(shù)生成科普數(shù)字人，為中小學(xué)生或特定用戶群體介紹科普內(nèi)容，這種應(yīng)用在科普基地、博物館等場(chǎng)所具有廣闊的發(fā)展空間。

AI時(shí)代不缺好答案，而是缺好問題。提出好問題可能是人們未來需要學(xué)習(xí)、提高的重要素質(zhì)。期待人工智能未來在科普內(nèi)容創(chuàng)作領(lǐng)域發(fā)揮更大的價(jià)值，助力全民科學(xué)素質(zhì)水平提升。

（作者：董霖，浙江省科普聯(lián)合會(huì)副會(huì)長(zhǎng)、每日互動(dòng)創(chuàng)始團(tuán)隊(duì)成員、首席數(shù)據(jù)官）

本文根據(jù)浙江省科普聯(lián)合會(huì)周四夜學(xué)內(nèi)容整理

DeepSeek如何賦能科普內(nèi)容創(chuàng)作？一文解鎖N種方法

DeepSeek如何賦能科普內(nèi)容創(chuàng)作？一文解鎖N種方法