版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

淺議:DeepSeek在AI軟件中并不是萬能的

科普文迅
原創(chuàng)
發(fā)表科普類文章,涉獵天文地理軍事生物等,希望大家喜歡
收藏

作者段躍初

最近,我在準備寫簡歷時,有一次不太愉快的AI使用體驗。我在深度求索(DeepSeek)輸入自己的名字,可DeepSeek給出的信息卻錯得離譜,它把我顯示成湖南省某家大公司的董事長。要是同名同姓的人也可以理解,但實際上網(wǎng)上顯示該公司法人代表的姓名和我只有一個字相同,集團旗下的多家公司負責(zé)人也根本不是我。并且使用Dee pSeek持續(xù)出現(xiàn)網(wǎng)絡(luò)不暢,無法回答的問題。這讓我對DeepSeek的信息準確性產(chǎn)生極大懷疑,這種錯誤在實際應(yīng)用中,很可能誤導(dǎo)他人。

這次經(jīng)歷讓我開始關(guān)注DeepSeek與其他國產(chǎn)軟件的差異。如今,人工智能發(fā)展得如火如荼,國產(chǎn)軟件也如雨后春筍般不斷涌現(xiàn),大家都在努力給用戶提供更優(yōu)質(zhì)、智能的服務(wù)。DeepSeek作為其中一員,自然也被放在了與其他軟件對比的天平上。

從功能性和性能來說,處理速度和準確度是衡量一款A(yù)I工具好不好用的關(guān)鍵。就拿我常用的豆包來講,在聊天機器人功能上,它理解問題特別快,回答也很準確,貼合語境。我之前寫工作匯報的時候,用豆包當寫作助手,它很快就能組織好語言,生成的文本邏輯清晰、內(nèi)容豐富,身邊不少用過的人都對它的響應(yīng)速度和內(nèi)容準確性贊不絕口。但DeepSeek在處理日常交流和寫作任務(wù)時,就沒給我?guī)磉@樣的驚喜,速度和準確性都差強人意。

功能豐富度上,DeepSeek也落后了?,F(xiàn)在好多國產(chǎn)AI軟件功能越來越多元化。有些軟件不僅能聊天,還能根據(jù)簡單的文字描述,生成精美的插畫、海報,甚至復(fù)雜的3D模型;在音樂創(chuàng)作方面,能根據(jù)設(shè)定的曲風(fēng)、節(jié)奏生成動聽的音樂片段,給創(chuàng)作者提供靈感;視頻制作上,還能根據(jù)素材和腳本快速剪輯合成視頻,添加各種特效和字幕??蒁eepSeek在這些方面幾乎是一片空白,功能基本就局限在基礎(chǔ)的知識問答和簡單的代碼生成,這就使得它在很多場景下都派不上用場。

面對復(fù)雜問題時,DeepSeek同樣面臨挑戰(zhàn)。雖說它宣稱自己有深度思考能力,可在處理復(fù)雜數(shù)學(xué)問題或編程任務(wù)時,表現(xiàn)遠不如天工。天工作為雙千億級大語言模型,處理復(fù)雜文本的能力十分強大,能支持10000字的文本對話,還能和用戶進行20輪以上的交互。比如處理長篇學(xué)術(shù)論文分析,天工可以深入理解內(nèi)容,精準提煉關(guān)鍵觀點,詳細總結(jié)分析。但DeepSeek面對同樣復(fù)雜的任務(wù),就很難做到像天工這樣游刃有余,這也表明它在復(fù)雜問題處理能力上還有很大的提升空間。

穩(wěn)定性和可靠性對用戶使用意愿的影響也很大。DeepSeek的服務(wù)器似乎經(jīng)常不堪重負,我和身邊的朋友使用時,頻繁收到“稍后重試”的提示。這和智普清言比起來,差距就很明顯。智普清言基于自主研發(fā)的中英雙語對話模型ChatGLM2,服務(wù)器負載能力很強,不管是日常咨詢還是高強度辦公協(xié)助,都能穩(wěn)定運行,讓用戶順利完成任務(wù)。但DeepSeek因為服務(wù)器問題,極大地影響了用戶體驗,頻繁等待不僅浪費時間,還容易讓人煩躁,久而久之,用戶對它的信任度和使用頻率都會降低。再加上網(wǎng)絡(luò)還經(jīng)常繁忙,更是讓用戶苦不堪言。

技術(shù)創(chuàng)新和研發(fā)投入是軟件持續(xù)發(fā)展的核心。DeepSeek號稱用極少成本訓(xùn)練出性能不輸給其他主流模型的AI工具,可這個說法并沒有得到廣泛驗證??纯刺旃ぃ鳛殡p千億級大語言模型,背后是巨大的研發(fā)投入和持續(xù)的技術(shù)創(chuàng)新。在模型訓(xùn)練過程中,天工不斷優(yōu)化算法,引入新技術(shù)理念,提升性能和泛化能力。對大量文本數(shù)據(jù)學(xué)習(xí)時,天工提取關(guān)鍵信息的效率更高,語言理解和生成方面表現(xiàn)也更出色。智普清言在自主研發(fā)能力上同樣突出,基于自主研發(fā)的模型,能根據(jù)不同應(yīng)用場景和用戶需求,靈活調(diào)整參數(shù),實現(xiàn)更精準的語言交互。但DeepSeek在自主研發(fā)上成果較少,缺乏標志性的技術(shù)突破,這對它未來的發(fā)展很不利。

市場認可和應(yīng)用范圍也是衡量軟件成功與否的重要標志。豆包、智普清言等軟件在政府、企業(yè)、教育等多個領(lǐng)域都得到了廣泛應(yīng)用。在政府部門,豆包能協(xié)助工作人員解讀政策、發(fā)布信息,提高工作效率和信息傳播的準確性;企業(yè)里,智普清言能提供智能客服、內(nèi)容創(chuàng)作等服務(wù),幫助企業(yè)提升客戶滿意度和品牌形象;教育領(lǐng)域,這些軟件還能作為智能輔導(dǎo)工具,為學(xué)生提供個性化學(xué)習(xí)支持。相比之下,DeepSeek的應(yīng)用范圍和深度都比較有限,沒能像其他軟件一樣深入各個領(lǐng)域,提供全方位服務(wù)。從用戶評價來看,雖然DeepSeek通過網(wǎng)絡(luò)宣傳有了一定知名度,但實際使用中,用戶對它的性能和功能評價并不高,很多人反映使用中問題多,滿足不了實際需求,市場口碑不太好。

綜合來看,DeepSeek在功能性和性能、穩(wěn)定性和可靠性、技術(shù)創(chuàng)新和研發(fā)投入、市場認可和應(yīng)用范圍以及社會責(zé)任和品牌形象等多個方面,都和其他國產(chǎn)軟件存在差距。不過,這些差距既是挑戰(zhàn),也是機遇。要是DeepSeek能不斷改進技術(shù)、優(yōu)化服務(wù)器性能、加大研發(fā)投入、拓展應(yīng)用領(lǐng)域,并且積極履行社會責(zé)任,還是很有希望在激烈的市場競爭中迎頭趕上,實現(xiàn)自身突破和發(fā)展的。這對整個國產(chǎn)軟件行業(yè)來說,也是一個警示,促使行業(yè)內(nèi)的企業(yè)不斷反思、進步,共同推動人工智能技術(shù)的發(fā)展和應(yīng)用,為社會創(chuàng)造更大的價值。

作者是中國未來研究會會員、中國科普作家協(xié)會會員

本文2025年2月18日原發(fā)表在新加坡聯(lián)合早報