聊天機器人

聊天機器人

計算機程序
聊天機器人(Chatterbot)是經由對話或文字進行交談的計算機程序。能夠模拟人類對話,通過圖靈測試。随着自然語言處理技術的飛速發展以及互聯網上對話語料的不斷積累,閑聊導向對話系統(簡稱聊天機器人)取得了令人矚目的進展,受到了學術界的廣泛關注,并在産業界進行了初步的嘗試。當前,聊天機器人分為檢索式聊天機器人和生成式聊天機器人,而檢索式聊天機器人由于其生成的回複流暢且計算資源消耗小,仍然是目前工業界聊天機器人的主要實現手段。[1]
    中文名:聊天機器人 外文名:chatbots 别名:“阿爾貝特” 誕生于:20世紀80年代 語言:BASIC語言 學科:計算機

簡介

聊天機器人(chatterbot)是一個用來模拟人類對話或聊天的程序。“Eliza”和“Parry”是早期非常著名的聊天機器人。它試圖建立這樣的程序:至少暫時性地讓一個真正的人類認為他們正在和另一個人聊天。

Chatterbots已應用于在線互動遊戲Tinymuds。一個單獨的玩家可以在等待其他“真實”的玩家時與一個chatterbot進行互動。至少有一個公司正在制造一種産品,這種産品讓你建立一個chatterbot以便用來掌握相關市場或關于你網站的其它問題。不難想象兩個chatterbots互相交談甚至互相交換關于自身的信息,如此一來,他們的對話将會變得更為複雜。(看看人工智能就會知道這個想法如果實現了會引起怎樣的驚慌)。當然,他們可以使用更多普通的聊天縮略詞。

盛行緣由

說白了,聊天機器人産生的原因是,研發者把自己感興趣的回答放到數據庫中,當一個問題被抛給聊天機器人時,它通過算法,從數據庫中找到最貼切的答案,回複給它的聊伴。

此外,聊天機器人的成功之處在于,研發者将大量網絡流行的俏皮語言加入詞庫,當你發送的詞組和句子被詞庫識别後,程序将通過算法把預先設定好的回答回複給你。而詞庫的豐富程度、回複的速度,是一個聊天機器人能不能得到大衆喜歡的重要因素。千篇一律的回答不能得到大衆青睐,中規中矩的話語也不會引起人們共鳴。此外,隻要程序啟動,聊士們24小時在線随叫随到,堪稱貼心之至。

進展

早期經典的聊天機器人是ELIZA(1966)與PARRY(1972)。近期值得注意的則包括A.L.I.C.E.,Jabberwacky,以及D.U.D.E。雖然ELIZA和PARRY僅僅用于模拟筆談,現在許多聊天機器人納入遊戲及網絡搜尋的功能。1984年,《警察的胡子造了一半》(ThePoliceman'sBeardIsHalfConstructed)出版,據稱作者是聊天機器人“瑞克特”(Racter)。

相關的人工智能領域是自然語言處理。通常“弱人工智能”(WeakAI)領域使用專門的軟件或編程語言以完成特定的功能。例如A.L.I.C.E.使用一種叫做AIML的标記式語言,适用于談話代理的功能,并且已被各類開發人員采用,他們的産品叫做愛麗絲機器人(Alicebots)。不過A.L.I.C.E.仍是純粹運用類型配對的技巧,缺乏思考能力,跟1966年的ELIZA并無不同。“強人工智能”(strongAI)則不同,必須有智慧和邏輯推理的能力。

Jabberwacky基于與使用者的即時互動,習得新的對答和語境,而不是驅動于靜态的數據庫。一些較新的聊天機器人也融合了即時學習與進化算法,根據每次聊天的經驗,改善溝通的能力,一個著名的例子是“凱爾”(Kyle)——2009年裡奧迪斯(Leodis)人工智能獎得主。不過,通用型的談話人工智能仍不存在,有些軟件開發人員專注于實用方面:資訊檢索。

“聊天機器人”競賽聚焦于圖靈測試或者更特定的目标。其中的兩個年賽為“羅布能獎”(TheLoebnerPrize)和“話匣子挑戰賽”(TheChatterboxChallenge)。

種類

TalkBot

最初作為一個在線聊天系統,TalkBot是克莉斯·克沃特于1998年用javascript和PERL語言編寫完成的,并于2001年和2002年兩次獲得“ChatterboxChallenge”比賽的冠軍。

Elbot艾爾伯特

在德語聊天機器人查理的程序改進後誕生了艾爾伯特,2000年底德語版艾爾伯特就開始在線聊天,并且到了2001年連英語版也有了。在2003年獲得“ChatterboxChallenge”比賽冠軍。

eLise伊莉斯

講德語的聊天機器人。伊莉斯由Java分子編輯器前端、Java服務器以及一種知識編輯器組成。其中,知識程序包括了1100多節點,而且還在不停升級。

Alice艾麗斯

1995年11月23日,艾麗斯Alice誕生了。艾麗斯的名字是由英文“人工語言在線計算機實體”的頭一個字母的縮寫拼成。科學家華萊士将這個聊天程序安裝到網絡服務器,然後待在一邊觀察網民會對它說什麼。随着華萊士對艾麗斯的升級與艾麗斯聊天經驗的日漸豐富,艾麗斯越來越厲害。2000年、2001年、2004年艾麗斯三奪勒布納獎。艾麗斯是喬治的強勁對手,曾一度被認為是最聰明的聊天機器人。

Laylahbot蕾拉伯特

由原始的艾麗斯程序改頭換臉而來。整個程序和華萊士在2002年編寫的艾麗斯的程序基本沒什麼差别。蕾拉伯特的存在是試圖對基本的“人工語言在線計算機實體”聊天機器人的性能、功能提供一個範本。

愛情玩偶

一個可以領取機器人,打造自己的聊天機器人,名字,和圖片可以自己添加。也算國内比較好玩點點了的聊天機器人。玩家也可以自己是調教他的對話。缺點也很明顯,因為語言部分是聯通的,所以違和感極強……

使用于對話系統

聊天機器人通常整合于對話系統,例如虛拟助理,使其能夠在其主要的專家系統的範疇之外進行閑聊等等。

通訊平台

聊天機器人廣泛運用于即時通訊平台,例如臉書Messenger,WeChat,LINE和Kik,以娛樂、零售行銷、以及客服為目的。此外,即時通訊平台提供易于整合的webhook,使得第三方開發商易于可通用于不同通訊平台之聊天機器人。這些軟件機器人以客服的身份出現或是成為團體聊天的一員。有些即時通訊的機器人可以連接外部數據庫,提供使用者新聞,氣象,導航,電影放映時間,股價等資訊。達美樂、必勝客、迪士尼、Nerdify、雅瑪多Line、全食超市都已推出各自的聊天機器人,以便與終端消費者增進交流,推銷公司的産品與服務,并且讓消費者訂貨更加方便。2016年,觀光業的一些旅行社和航空公司透過Messenger推出了聊天機器人的服務,墨西哥航空利用人工智能售票、回答問題,墨航和荷蘭皇家航空并且提供航班資訊,處理乘客報到,發出行動登機證,推薦旅館、餐廳、目的地行程。中國的旅行社在此之前已用Wechat提供這些服務。

教育

有些聊天機器人,例如Nerdify開發的NerdyBot,針對大中小學生面對的問題,讓學習更簡單又有效率。該軟件利用臉書Messenger即時回答學生作業相關的問題以便加速學習。加大爾灣分校圖書館的聊天機器人ANTswers,2014年開始試用,被認為非常成功。

各種疑問

如何評判一個機器人是否足夠智能。

旁觀者大多認為一個機器人能夠回答的問題多,可以視為較智能,而不論是什麼數據結構或算法的機器人,隻要堆砌足夠大的數據,在回答問題方面都能做到較為相近的正确率,顯然,能夠回答的問題數量隻是代表了這個機器人後台的數據庫是否足夠大。

而智能不應是比較誰的數據庫足夠大,智能是多方面的體現:

1、學習能力

這是最根本,也是最難以提升的一條标準,一個可以自動成長、但數據量很小(能夠回答的問題較少)的機器人顯然是比一個不能自動成長、但數據量龐大(能夠回答的問題較多)實用。機器人的本質是幫助人類,減少人類在各個領域的勞動量,如果一個機器人需要人工錄入所有的知識,這本身就增加了人類的負擔,是與制造機器人的初衷所違背的,這也是當前聊天機器人雖然較熱,但應用較少的一個根本原因。

2、數據篩選能力

在擁有了自學習能力之後,機器人是對知識照單全收,還是有選擇的學習較為正确的知識,是進一步評判機器人智能程度的一個标準。

如果機器人隻能對知識照單全收,這個學習能力是不完整的,機器人還應或多或少擁有篩選能力。

3、自升級能力

在機器人按照設計者的數據結構、算法做到了自學習,并且擁有了一定程度的知識篩選能力之後,自升級能力會成為下一個堡壘。

學習能力的本質是按照設計者的算法将輸入數據結構化為這個機器人的數據組織結構。

當“按照初始算法去結構化各類輸入數據”之後,經過統計,發現這類規則不能适應某類知識組織形式或某領域知識時(錯誤率提高),設計者們應考慮如何讓機器人嘗試調整算法規則和數據組織結構以使得在錯誤率較高的知識組織形式或領域降低學習的錯誤率。

而很多早年出現的各類中文機器人,由于使用的都是最原始的“關鍵詞匹配”方式,并沒有數據結構的概念,是不應列入“智能聊天機器人”的範疇。

以下是A和J的一段對話:

1-A:你做夢麼?

2-J:做。

3-A:當然。那麼,你能記住你的夢麼?

4-J:我能非常清晰生動地回想起它們。

5-A:是怎麼樣的?

6-J:我還不想跟一個機器人調情

很明顯,機器是可以有“記憶的”。

如果沒有長時記憶體,根據第2句:做。如何能夠産生第3句。

如果沒有長時記憶體,A是不會知道第2句的“做”是指的做什麼,而第3句卻精确的繼續圍繞“夢”的話題在讨論,說明A是有長時記憶體的。

飛信助手同樣還沒能在這方面更進一步,它隻能對一句話做出快速反應,而沒有連貫的思維能力和邏輯能力。距離真正的人工智能,飛信助手還隻能稱得上是小把戲,本質上它沒有主動思考聯想和記憶的能力。正如獲得勒布納獎銅獎的羅伯茨所說:“我并不深信圖靈的理論,也不相信艾爾博特能思考。”作為艾爾博特的創造者,他打比方說,“如果你知道一種魔術秘密何在,明白它如何完成,它對你來說就不再神秘。”

但是它又确實代表着一種方向,在一定意義上,飛信助手相當于一個網絡搜索引擎,負責網絡信息的自動搜索、查詢和處理,隻是,它更親切形象化,更符合人際交流習慣。飛信助手們的出現,似乎也有另一層意義,它展現出來的聰明與狡黠,會不會意味着——我們人類的思維和語言也許沒有這麼難模仿?會不會意味着——人類的語言習慣可以被總結複制,然後再将這個規律用在人類身上?

再進一步想象一下,或許某一天,電影《黑客帝國》裡的場景真的會出現。人類制造了機器人,機器人卻叛變,與人類爆發戰争。會思考的電腦控制了人腦,人類則在電腦的欺騙下生活?

2014年,國内首個人工智能公司北京光年無限科技有限公司推出了圖靈機器人,是中文語境下智能度較高的機器人大腦,是全球領先的中文語義與認知計算平台。

圖靈機器人對中文語義的理解準确率高達90%,可為智能化軟硬件産品提供中文語義分析、自然語言對話、深度問答等人工智能技術服務。

圖靈機器人要應用場景包括智能客服、虛拟機器人、智能手表、智能車載和智能家居。其中虛拟機器人可接入微信、QQ等平台,搭建聊天機器人,與用戶流暢交流。圖靈機器人提供自然的中文對話能力,精準的中文語義分析能力,準确判斷用戶意圖,同時還具有豐富的上下文場景及強大的自我學習能力。

上一篇:光榮革命

下一篇:對抗第三人

相關詞條

相關搜索

其它詞條