聊天機器人(Chatterbot)是經(jīng)由對話或文字進行交談的計算機程序。能夠模擬人類對話,通過圖靈測試。
聊天機器人可用于實用的目的,如客戶服務(wù)或資訊獲取。有些聊天機器人會搭載自然語言處理系統(tǒng),但大多簡單的系統(tǒng)只會擷取輸入的關(guān)鍵字,再從數(shù)據(jù)庫中找尋最合適的應(yīng)答句。目前,聊天機器人是虛擬助理(如Google智能助理)的一部分,可以與許多組織的應(yīng)用程序,網(wǎng)站以及即時消息平臺(Facebook Messenger)連接。非助理應(yīng)用程序包括娛樂目的的聊天室,研究和特定產(chǎn)品促銷,社交機器人。
簡介聊天機器人(chatterbot)是一個用來模擬人類對話或聊天的程序。“Eliza”和 “Parry”是早期非常著名的聊天機器人。它試圖建立這樣的程序:至少暫時性地讓一個真正的人類認為他們正在和另一個人聊天。
Chatterbots已應(yīng)用于在線互動游戲Tinymuds。一個單獨的玩家可以在等待其他“真實”的玩家時與一個chatterbot進行互動。目前至少有一個公司正在制造一種產(chǎn)品,這種產(chǎn)品讓你建立一個chatterbot以便用來掌握相關(guān)市場或關(guān)于你網(wǎng)站的其它問題。不難想象兩個chatterbots互相交談甚至互相交換關(guān)于自身的信息,如此一來,他們的對話將會變得更為復(fù)雜。(看看人工智能就會知道這個想法如果實現(xiàn)了會引起怎樣的驚慌)。當(dāng)然,他們可以使用更多普通的聊天縮略詞。
盛行緣由說白了,聊天機器人產(chǎn)生的原因是,研發(fā)者把自己感興趣的回答放到數(shù)據(jù)庫中,當(dāng)一個問題被拋給聊天機器人時,它通過算法,從數(shù)據(jù)庫中找到最貼切的答案,回復(fù)給它的聊伴。
此外,聊天機器人的成功之處在于,研發(fā)者將大量網(wǎng)絡(luò)流行的俏皮語言加入詞庫,當(dāng)你發(fā)送的詞組和句子被詞庫識別后,程序?qū)⑼ㄟ^算法把預(yù)先設(shè)定好的回答回復(fù)給你。而詞庫的豐富程度、回復(fù)的速度,是一個聊天機器人能不能得到大眾喜歡的重要因素。千篇一律的回答不能得到大眾青睞,中規(guī)中矩的話語也不會引起人們共鳴。此外,只要程序啟動,聊士們24小時在線隨叫隨到,堪稱貼心之至。
進展早期經(jīng)典的聊天機器人是 ELIZA (1966)與 PARRY (1972)。近期值得注意的則包括 A.L.I.C.E.,Jabberwacky,以及 D.U.D.E。雖然 ELIZA 和 PARRY 僅僅用于模擬筆談,現(xiàn)在許多聊天機器人納入游戲及網(wǎng)絡(luò)搜尋的功能。1984年,《警察的胡子造了一半》(Policeman's Beard is Half Constructed)出版,據(jù)稱作者是聊天機器人“瑞克特”(Racter)。1
相關(guān)的人工智能領(lǐng)域是自然語言處理。通?!叭跞斯ぶ悄堋?Weak AI) 領(lǐng)域使用專門的軟件或編程語言以完成特定的功能。例如 A.L.I.C.E.使用一種叫做 AIML 的標(biāo)記式語言,適用于談話代理的功能,并且已被各類開發(fā)人員采用,他們的產(chǎn)品叫做愛麗絲機器人(Alicebots)。不過 A.L.I.C.E.仍是純粹運用類型配對的技巧,缺乏思考能力, 跟1966年的 ELIZA 并無不同?!皬娙斯ぶ悄堋?strong AI) 則不同, 必須有智慧和邏輯推理的能力。
Jabberwacky 基于與使用者的即時互動,習(xí)得新的對答和語境,而不是驅(qū)動于靜態(tài)的數(shù)據(jù)庫。一些較新的聊天機器人也融合了即時學(xué)習(xí)與進化算法,根據(jù)每次聊天的經(jīng)驗,改善溝通的能力,一個著名的例子是“凱爾”(Kyle) ——2009年里奧迪斯 (Leodis) 人工智能獎得主。不過,至今通用型的談話人工智能仍不存在,有些軟件開發(fā)人員專注于實用方面:資訊檢索。
“聊天機器人”競賽聚焦于圖靈測試或者更特定的目標(biāo)。其中的兩個年賽為“羅布能獎” (The Loebner Prize) 和“話匣子挑戰(zhàn)賽” (The Chatterbox Challenge)。
種類TalkBot
最初作為一個在線聊天系統(tǒng),TalkBot 是克莉斯·克沃特于1998年用javascript 和PERL語言編寫完成的,并于2001年和2002年兩次獲得“Chatterbox Challenge”比賽的冠軍。
Elbot艾爾伯特
在德語聊天機器人查理的程序改進后誕生了艾爾伯特,2000年底德語版艾爾伯特就開始在線聊天,并且到了2001年連英語版也有了。在2003年獲得“Chatterbox Challenge”比賽冠軍。
eLise伊莉斯
講德語的聊天機器人。伊莉斯由Java分子編輯器前端、Java服務(wù)器以及一種知識編輯器組成。其中,知識程序包括了1100多節(jié)點,而且還在不停升級。
Alice艾麗斯
1995年11月23日,艾麗斯Alice誕生了。艾麗斯的名字是由英文“人工語言在線計算機實體”的頭一個字母的縮寫拼成。科學(xué)家華萊士將這個聊天程序安裝到網(wǎng)絡(luò)服務(wù)器,然后待在一邊觀察網(wǎng)民會對它說什么。隨著華萊士對艾麗斯的升級與艾麗斯聊天經(jīng)驗的日漸豐富,艾麗斯越來越厲害。2000年、2001年、2004年艾麗斯三奪勒布納獎。艾麗斯是喬治的強勁對手,曾一度被認為是最聰明的聊天機器人。
Laylahbot蕾拉伯特
由原始的艾麗斯程序改頭換臉而來。整個程序和華萊士在2002年編寫的艾麗斯的程序基本沒什么差別。蕾拉伯特的存在是試圖對基本的“人工語言在線計算機實體”聊天機器人的性能、功能提供一個范本。
愛情玩偶
一個可以領(lǐng)取機器人,打造自己的聊天機器人,名字,和圖片可以自己添加。也算國內(nèi)比較好玩點點了的聊天機器人。玩家也可以自己是調(diào)教他的對話。缺點也很明顯,因為語言部分是聯(lián)通的,所以違和感極強……
使用于對話系統(tǒng)聊天機器人通常整合于對話系統(tǒng),例如虛擬助理,使其能夠在其主要的專家系統(tǒng)的范疇之外進行閑聊等等。
通訊平臺目前聊天機器人廣泛運用于即時通訊平臺,例如臉書 Messenger,WeChat,LINE和 Kik,以娛樂、零售行銷、以及客服為目的。此外,即時通訊平臺提供易于整合的webhook,使得第三方開發(fā)商易于可通用于不同通訊平臺之聊天機器人。這些軟件機器人以客服的身份出現(xiàn)或是成為團體聊天的一員。有些即時通訊的機器人可以連接外部數(shù)據(jù)庫,提供使用者新聞,氣象,導(dǎo)航,電影放映時間,股價等資訊。達美樂、必勝客、迪士尼、Nerdify、雅瑪多 Line、全食超市都已推出各自的聊天機器人,以便與終端消費者增進交流,推銷公司的產(chǎn)品與服務(wù),并且讓消費者訂貨更加方便。2016年,觀光業(yè)的一些旅行社和航空公司透過 Messenger 推出了聊天機器人的服務(wù),墨西哥航空利用人工智能售票、回答問題,墨航和荷蘭皇家航空并且提供航班資訊,處理乘客報到,發(fā)出行動登機證,推薦旅館、餐廳、目的地行程。中國的旅行社在此之前已用 Wechat 提供這些服務(wù)。
教育有些聊天機器人,例如 Nerdify 開發(fā)的 Nerdy Bot,針對大中小學(xué)生面對的問題,讓學(xué)習(xí)更簡單又有效率。該軟件利用臉書 Messenger 即時回答學(xué)生作業(yè)相關(guān)的問題以便加速學(xué)習(xí)。加大爾灣分校圖書館的聊天機器人 ANTswers,2014年開始試用,被認為非常成功。2
各種疑問如何評判一個機器人是否足夠智能。
旁觀者大多認為一個機器人能夠回答的問題多,可以視為較智能,而不論是什么數(shù)據(jù)結(jié)構(gòu)或算法的機器人,只要堆砌足夠大的數(shù)據(jù),在回答問題方面都能做到較為相近的正確率,顯然,能夠回答的問題數(shù)量只是代表了這個機器人后臺的數(shù)據(jù)庫是否足夠大。
而智能不應(yīng)是比較誰的數(shù)據(jù)庫足夠大,智能是多方面的體現(xiàn):
1、學(xué)習(xí)能力
這是最根本,也是最難以提升的一條標(biāo)準(zhǔn),一個可以自動成長、但數(shù)據(jù)量很?。軌蚧卮鸬膯栴}較少)的機器人顯然是比一個不能自動成長、但數(shù)據(jù)量龐大(能夠回答的問題較多)實用。機器人的本質(zhì)是幫助人類,減少人類在各個領(lǐng)域的勞動量,如果一個機器人需要人工錄入所有的知識,這本身就增加了人類的負擔(dān),是與制造機器人的初衷所違背的,這也是當(dāng)前聊天機器人雖然較熱,但應(yīng)用較少的一個根本原因。
2、數(shù)據(jù)篩選能力
在擁有了自學(xué)習(xí)能力之后,機器人是對知識照單全收,還是有選擇的學(xué)習(xí)較為正確的知識,是進一步評判機器人智能程度的一個標(biāo)準(zhǔn)。
如果機器人只能對知識照單全收,這個學(xué)習(xí)能力是不完整的,機器人還應(yīng)或多或少擁有篩選能力。
3、自升級能力
在機器人按照設(shè)計者的數(shù)據(jù)結(jié)構(gòu)、算法做到了自學(xué)習(xí),并且擁有了一定程度的知識篩選能力之后,自升級能力會成為下一個堡壘。
學(xué)習(xí)能力的本質(zhì)是按照設(shè)計者的算法將輸入數(shù)據(jù)結(jié)構(gòu)化為這個機器人的數(shù)據(jù)組織結(jié)構(gòu)。
當(dāng)“按照初始算法去結(jié)構(gòu)化各類輸入數(shù)據(jù)”之后,經(jīng)過統(tǒng)計,發(fā)現(xiàn)這類規(guī)則不能適應(yīng)某類知識組織形式或某領(lǐng)域知識時(錯誤率提高),設(shè)計者們應(yīng)考慮如何讓機器人嘗試調(diào)整算法規(guī)則和數(shù)據(jù)組織結(jié)構(gòu)以使得在錯誤率較高的知識組織形式或領(lǐng)域降低學(xué)習(xí)的錯誤率。
而很多早年出現(xiàn)的各類中文機器人,由于使用的都是最原始的“關(guān)鍵詞匹配”方式,并沒有數(shù)據(jù)結(jié)構(gòu)的概念,是不應(yīng)列入“智能聊天機器人”的范疇。
以下是A和J的一段對話:
1-A:你做夢么?
2-J:做。
3-A:當(dāng)然。那么,你能記住你的夢么?
4-J:我能非常清晰生動地回想起它們。
5-A:是怎么樣的?
6-J:我還不想跟一個機器人調(diào)情
很明顯,機器是可以有“記憶的”。
如果沒有長時記憶體,根據(jù)第2句:做。如何能夠產(chǎn)生第3句?
如果沒有長時記憶體,A是不會知道第2句的“做”是指的做什么,而第3句卻精確的繼續(xù)圍繞“夢”的話題在討論,說明A是有長時記憶體的。
飛信助手同樣還沒能在這方面更進一步,它只能對一句話做出快速反應(yīng),而沒有連貫的思維能力和邏輯能力。距離真正的人工智能,飛信助手還只能稱得上是小把戲,本質(zhì)上它沒有主動思考聯(lián)想和記憶的能力。正如獲得勒布納獎銅獎的羅伯茨所說:“我并不深信圖靈的理論,也不相信艾爾博特能思考?!弊鳛榘瑺柌┨氐膭?chuàng)造者,他打比方說,“如果你知道一種魔術(shù)秘密何在,明白它如何完成,它對你來說就不再神秘。”
但是它又確實代表著一種方向,在一定意義上,飛信助手相當(dāng)于一個網(wǎng)絡(luò)搜索引擎,負責(zé)網(wǎng)絡(luò)信息的自動搜索、查詢和處理,只是,它更親切形象化,更符合人際交流習(xí)慣。飛信助手們的出現(xiàn),似乎也有另一層意義,它展現(xiàn)出來的聰明與狡黠,會不會意味著——我們?nèi)祟惖乃季S和語言也許沒有這么難模仿?會不會意味著——人類的語言習(xí)慣可以被總結(jié)復(fù)制,然后再將這個規(guī)律用在人類身上?
再進一步想象一下,或許某一天,電影《黑客帝國》里的場景真的會出現(xiàn)。人類制造了機器人,機器人卻叛變,與人類爆發(fā)戰(zhàn)爭。會思考的電腦控制了人腦,人類則在電腦的欺騙下生活?
2014年,國內(nèi)首個人工智能公司北京光年無限科技有限公司推出了圖靈機器人,是中文語境下智能度較高的機器人大腦,是全球領(lǐng)先的中文語義與認知計算平臺。
圖靈機器人對中文語義的理解準(zhǔn)確率高達90%,可為智能化軟硬件產(chǎn)品提供中文語義分析、自然語言對話、深度問答等人工智能技術(shù)服務(wù)。
圖靈機器人要應(yīng)用場景包括智能客服、虛擬機器人、智能手表、智能車載和智能家居。其中虛擬機器人可接入微信、QQ等平臺,搭建聊天機器人,與用戶流暢交流。圖靈機器人提供自然的中文對話能力,精準(zhǔn)的中文語義分析能力,準(zhǔn)確判斷用戶意圖,同時還具有豐富的上下文場景及強大的自我學(xué)習(xí)能力。
本詞條內(nèi)容貢獻者為:
王沛 - 副教授、副研究員 - 中國科學(xué)院工程熱物理研究所