版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

DeepSeek如何賦能科普內(nèi)容創(chuàng)作?一文解鎖N種方法

科小二
浙江省科普聯(lián)合會(huì)官方科普號(hào),讓科普更靠譜。
收藏

DeepSeek公司背景與發(fā)展

DeepSeek于2023年成立,其母公司幻方量化在量化投資領(lǐng)域成績(jī)斐然,是國(guó)內(nèi)頂尖的量化投資公司,管理規(guī)模曾一度突破千億大關(guān)。2020年3月,幻方量化建立螢火一號(hào)算力集群,緊接著在2021年建立螢火二號(hào),二者共同構(gòu)成了當(dāng)時(shí)亞洲規(guī)模最大的私有化AI算力池,擁有近萬張A100 卡。當(dāng)時(shí),幻方量化出于自身量化投資對(duì)算力的需求建立此算力池,同時(shí)面向公眾開放使用。這一舉措為后來大模型的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ),也展現(xiàn)了幻方量化在技術(shù)布局上的前瞻性。

DeepSeek模型發(fā)展歷程

DeepSeek在模型研發(fā)上穩(wěn)步推進(jìn),2024年初推出首個(gè)大模型版本,起初在行業(yè)內(nèi)并未引起較大轟動(dòng)。然而,2024年5月推出的V2版本開始嶄露頭角,性能對(duì)標(biāo)GPT-4,而價(jià)格僅為GPT-4的百分之一。在國(guó)外學(xué)術(shù)圈和工業(yè)圈,它早早受到關(guān)注,特別是在代碼開發(fā)領(lǐng)域表現(xiàn)突出,成為國(guó)外眾多AI Coding軟件中唯一集成的國(guó)產(chǎn)大模型。去年年底推出的V3和R1版本更是引起了國(guó)內(nèi)外的廣泛關(guān)注,其模型性能對(duì)標(biāo)國(guó)外最頂尖的OpenAI-o1模型,充分展示了DeepSeek在技術(shù)研發(fā)上的實(shí)力。

DeepSeek技術(shù)優(yōu)勢(shì)剖析

基于強(qiáng)化學(xué)習(xí)的訓(xùn)練方式

DeepSeek-R1的Zero版本基于大規(guī)模強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練,拋棄了傳統(tǒng)的基于人類標(biāo)注反饋數(shù)據(jù)訓(xùn)練的獎(jiǎng)勵(lì)模型,選擇了客觀評(píng)價(jià)指標(biāo)作為獎(jiǎng)勵(lì)模型。這種獎(jiǎng)勵(lì)模型主要基于兩個(gè)核心要點(diǎn):一是回答的答案是否準(zhǔn)確,即是否可通過計(jì)算規(guī)則進(jìn)行檢驗(yàn);二是答案格式是否符合要求,即是否包含了思考的過程。以回答數(shù)學(xué)問題為例,若模型簡(jiǎn)單回答正確記1分,若通過邏輯推理得出正確答案則記2分,答案錯(cuò)誤記0分;在代碼生成任務(wù)中,通過編譯器運(yùn)行結(jié)果判斷,符合預(yù)期記1分,編譯失敗或結(jié)果錯(cuò)誤記0分,有思考過程會(huì)額外加分。與傳統(tǒng)依賴人類標(biāo)注的方式相比,DeepSeek的評(píng)價(jià)方式更加客觀,有效避免了人類標(biāo)注存在的效率和準(zhǔn)確率問題,同時(shí)也規(guī)避了人工反饋帶來的主觀和價(jià)值觀因素影響。

創(chuàng)新的模型架構(gòu)

在模型架構(gòu)方面,DeepSeek有諸多創(chuàng)新。DeepSeek采取目前流行的混合專家(MoE)架構(gòu),MoE借鑒了人類大腦的工作原理。大腦的不同區(qū)域負(fù)責(zé)不同功能,如前額葉負(fù)責(zé)邏輯推理,顳葉中的梭狀回面孔區(qū)負(fù)責(zé)人臉識(shí)別、而海馬體負(fù)責(zé)記憶等。MoE架構(gòu)下參數(shù)量雖大,但特定任務(wù)僅由特定的一小部分參數(shù)處理,這極大地降低了計(jì)算消耗,同時(shí)也便于對(duì)參數(shù)權(quán)重進(jìn)行定向優(yōu)化。此外,DeepSeek自主創(chuàng)新的MLA模型通過算法調(diào)整,減少了推理過程的KV Cache,降低了顯存消耗,進(jìn)而提高了推理效率。這兩種架構(gòu)的結(jié)合,為DeepSeek的高性能表現(xiàn)提供了有力支持。

軟硬件協(xié)同優(yōu)化策略

雖然DeepSeek很早就建設(shè)了萬卡集群,但是與國(guó)外同行相比,規(guī)模依然不足。面對(duì)算力資源的限制,DeepSeek采用了精細(xì)的調(diào)度算法,壓榨硬件的每一分算力。傳統(tǒng)方式在訓(xùn)練時(shí),參數(shù)權(quán)重更新需一層一層按順序處理,存在排隊(duì)等待的情況,導(dǎo)致算力利用率不高。而DeepSeek的DualPipe調(diào)度算法類似于流程優(yōu)化,通過合理安排前向過程、后向過程以及層間通訊,使有前后依賴的任務(wù)緊密協(xié)作,從而在最短時(shí)間內(nèi)完成一輪迭代訓(xùn)練。這種軟硬件協(xié)同的方式,在國(guó)產(chǎn)GPU算力與英偉達(dá)GPU存在差距的情況下,通過軟件優(yōu)化彌補(bǔ)了硬件的不足,為AI產(chǎn)業(yè)的發(fā)展開辟了新的路徑。

DeepSeek的特點(diǎn)

DeepSeek的以下幾個(gè)特點(diǎn),使其成為獨(dú)樹一幟的標(biāo)桿。

首先,其訓(xùn)練成本大幅下降,外媒報(bào)道僅需幾百萬美元,與之前動(dòng)輒上億的訓(xùn)練成本相比成本顯著降低。同時(shí),通過蒸餾DeepSeek生成高質(zhì)量的推理數(shù)據(jù),再利用這些數(shù)據(jù)微調(diào)像千問、Llama等開源小模型,用極低成本大幅提升了這些小模型的性能。

其次,DeepSeek將最大規(guī)模的671B模型參數(shù)完全公開,且開源協(xié)議非常寬松,允許自由修改、復(fù)制和商業(yè)化,這消除了企業(yè)在數(shù)據(jù)安全方面的顧慮,使企業(yè)能夠放心地在自己的環(huán)境內(nèi)部署私有化版本,將企業(yè)內(nèi)部的文檔、技術(shù)資料甚至財(cái)務(wù)數(shù)據(jù)用于大模型的問答和應(yīng)用,掃除了大模型應(yīng)用的最大障礙。

因此,DeepSeek徹底顛覆了AI產(chǎn)業(yè)原有的商業(yè)模式,原來通過商用模型部署的業(yè)務(wù)模式因DeepSeek的出現(xiàn)而發(fā)生巨大改變。

DeepSeek使用經(jīng)驗(yàn)分享

訪問與替代方案

目前,DeepSeek提供了官網(wǎng)和APP供用戶使用,但是因用戶量爆棚,在使用時(shí)可能會(huì)出現(xiàn)不穩(wěn)定的情況。在這種情況下,有一些替代方案可供選擇,如騰訊元寶和 納米搜索等。這些平臺(tái)支持全尺寸模型的問答功能,還具備聯(lián)網(wǎng)搜索和文件上傳等功能,在DeepSeek官網(wǎng)不穩(wěn)定時(shí)能為用戶提供備用方案。

使用技巧與注意事項(xiàng)

使用DeepSeek時(shí),打開“深度思考”開關(guān)至關(guān)重要,因?yàn)樵撻_關(guān)關(guān)閉時(shí)使用的是V3非推理模型,而打開后則調(diào)用R1推理模型,能獲得更強(qiáng)大的功能。在提問方式上,相比以往復(fù)雜的提示詞工程,DeepSeek推薦使用更自然的表達(dá)方式。用戶只需專注描述問題的背景信息、明確自己的目標(biāo)以及添加風(fēng)格提示等,例如要求“面向初中生以魯迅風(fēng)格寫一篇食品類科普文章”。此外,強(qiáng)烈推薦用戶閱讀清華大學(xué)出版的關(guān)于DeepSeek使用介紹的 PPT,其中詳細(xì)介紹了向DeepSeek提問的技巧,有助于用戶更好地與模型進(jìn)行交互。

如何將DeepSeek用于科普創(chuàng)作?

科普主題發(fā)掘

DeepSeek在科普主題發(fā)掘方面具有很大的潛力。它可以在特定領(lǐng)域,如前沿科技、城市生活常識(shí)、當(dāng)下流行的偽科學(xué)等方向,為創(chuàng)作者提供科普主題。同時(shí),還能根據(jù)不同的受眾群體,生成相應(yīng)的主題。例如,針對(duì)60~70歲的老人,DeepSeek會(huì)提供圍繞健康管理方面的三高管理、科學(xué)飲食,以及退休后的心理健康指南等主題;而針對(duì)青少年破除偽科學(xué)的需求,DeepSeek會(huì)提供星座算命、手機(jī)致癌、外星人綁架等新奇有趣的主題。此外,結(jié)合近期熱點(diǎn)新聞,DeepSeek能從熱點(diǎn)話題中篩選出有價(jià)值的科普主題,如根據(jù)近期小行星撞地球的熱點(diǎn)話題,為科普創(chuàng)作提供靈感。

科普內(nèi)容生成

基于給定的科普主題,DeepSeek能夠?yàn)椴煌鼙娚舍槍?duì)性的科普內(nèi)容。以人造太陽的科普為例,當(dāng)要求為小學(xué)三年級(jí)學(xué)生創(chuàng)作科普文章時(shí),它會(huì)避免使用專業(yè)術(shù)語,盡量用淺顯易懂的語言描述人造太陽的價(jià)值和功能;而當(dāng)為高中三年級(jí)學(xué)生創(chuàng)作時(shí),則會(huì)包含科學(xué)專業(yè)術(shù)語和相關(guān)數(shù)據(jù),適合高中學(xué)生作為課外拓展閱讀。DeepSeek還可以生成短視頻腳本,為科普短視頻的制作提供便利。同時(shí),在科普分級(jí)讀物方面,它具有生成不同難度文章的能力,通過難度設(shè)定可以精確匹配不同閱讀水平的需求,這對(duì)于中文科普分級(jí)讀物的發(fā)展具有重要意義。

此外,在科普訪談方面,DeepSeek可以根據(jù)訪談對(duì)象和主題,結(jié)合互聯(lián)網(wǎng)上的相關(guān)材料,生成定制化的訪談提綱。訪談結(jié)束后,還能根據(jù)訪談文字稿輔助生成總結(jié)文章,提高工作效率。在處理國(guó)外前沿論文時(shí),DeepSeek可以將論文內(nèi)容轉(zhuǎn)化為有趣的科普文章,在內(nèi)容風(fēng)格上并非機(jī)械解讀,而是結(jié)合科普宣傳的需求,吸引讀者的注意力。

拓展應(yīng)用場(chǎng)景

DeepSeek結(jié)合其他技術(shù),能夠拓展科普內(nèi)容創(chuàng)作的邊界。例如,結(jié)合簡(jiǎn)易AI自動(dòng)化匹配視頻素材并進(jìn)行剪輯,再結(jié)合文本生成語音(TTS)技術(shù),可以制作完整的科普短視頻;結(jié)合豆包進(jìn)行文本生成,實(shí)現(xiàn)圖文混排,使科普內(nèi)容更具吸引力;結(jié)合Kimi等相關(guān)工具可以制作科普PPT,用于展示科普知識(shí);結(jié)合數(shù)字人技術(shù)生成科普數(shù)字人,為中小學(xué)生或特定用戶群體介紹科普內(nèi)容,這種應(yīng)用在科普基地、博物館等場(chǎng)所具有廣闊的發(fā)展空間。

AI時(shí)代不缺好答案,而是缺好問題。提出好問題可能是人們未來需要學(xué)習(xí)、提高的重要素質(zhì)。期待人工智能未來在科普內(nèi)容創(chuàng)作領(lǐng)域發(fā)揮更大的價(jià)值,助力全民科學(xué)素質(zhì)水平提升。

(作者:董霖,浙江省科普聯(lián)合會(huì)副會(huì)長(zhǎng)、每日互動(dòng)創(chuàng)始團(tuán)隊(duì)成員、首席數(shù)據(jù)官)

本文根據(jù)浙江省科普聯(lián)合會(huì)周四夜學(xué)內(nèi)容整理

評(píng)論
李海劍
太師級(jí)
AI時(shí)代不缺好答案,而是缺好問題。提出好問題可能是人們未來需要學(xué)習(xí)、提高的重要素質(zhì)。期待人工智能未來在科普內(nèi)容創(chuàng)作領(lǐng)域發(fā)揮更大的價(jià)值,助力全民科學(xué)素質(zhì)水平提升。
2025-02-25
無為通達(dá)
少傅級(jí)
DeepSeek在科普內(nèi)容創(chuàng)作方面具有顯著優(yōu)勢(shì),能夠幫助創(chuàng)作者快速獲取權(quán)威資料、構(gòu)建吸引人的內(nèi)容框架、優(yōu)化語言表達(dá)與數(shù)據(jù)呈現(xiàn)、生成個(gè)性化科普內(nèi)容與案例、提供配圖與多媒體內(nèi)容創(chuàng)作支持以及進(jìn)行質(zhì)量把關(guān)和倫理法律注意事項(xiàng)的提醒。因此,善用DeepSeek可以大大提高科普內(nèi)容創(chuàng)作的效率和質(zhì)量。
2025-02-25
科普 【大美里則】
學(xué)士級(jí)
已學(xué)習(xí)
2025-03-07