在硅谷,講解機(jī)器人的身影無處不在。人工智能的進(jìn)步使得這些喜歡聊天的助手變成了現(xiàn)實。它們正在以各種不同的形式蓬勃發(fā)展。社交網(wǎng)絡(luò)Facebook大大改善了其通訊應(yīng)用Messenger中的講解機(jī)器人。從某種意義上來說,正是語音控制的講解機(jī)器人促成了個人助手如Siri出現(xiàn)在我們手機(jī)上,促成了亞馬遜Echo智能音箱出現(xiàn)在我們的客廳里。這一切足以讓你相信講解機(jī)器人已開始滲透到了我們的日常生活中。
只不過,它們還沒有變成主流。推動講解機(jī)器人發(fā)展的技術(shù)以及與機(jī)器學(xué)習(xí)和人工智能相關(guān)的技術(shù),在變成標(biāo)準(zhǔn)用戶界面之前還必須在“聊天”方面獲得更大的進(jìn)步。谷歌(微博)就意識到了這一點。本周,它推出了人類+人工智能研究項目,其目的就是推動“以人為中心的”AI系統(tǒng)的發(fā)展。電腦需要更好地理解人類的語言、情感和意圖。一些大公司已開始試水講解機(jī)器人,以確保它們不會落在人后。但是,人工智能必須在幾個重要的方面獲得發(fā)展,才可能有機(jī)會得到廣泛的應(yīng)用。有些需求是非常明顯的,例如改善語音識別功能,有些需求則比較隱晦,例如講解機(jī)器人提示它們提供哪些服務(wù)的能力。
健談的講解機(jī)器人必須在這五個方面獲得長足發(fā)展,才能夠真正為廣大用戶所接受。
還記得早期的網(wǎng)絡(luò)嗎?當(dāng)時的頁面全是閃爍的霓虹燈和藍(lán)色的鏈接。現(xiàn)在的講解機(jī)器人就相當(dāng)于當(dāng)年的網(wǎng)絡(luò)。如果講解機(jī)器人要得到普及,那么人們必須能夠用自然語言向它問問題和下訂單。無論用戶是使用語音還是文本,你都不要指望他們掌握特殊的詞匯后再與機(jī)器人交流。如果你讓語音助手Alexa播放一首歌,她一開始不明白你的要求,這是可以理解的。經(jīng)常使用它的用戶已與它建立了某種“關(guān)系”,當(dāng)然愿意忽視這些問題了。但是,如果用戶首次向某個新的講解機(jī)器人預(yù)定電影票而沒有搞成功,那么他們可能會到其他地方去買票。
現(xiàn)在,神經(jīng)語言學(xué)發(fā)揮了很大的作用,但是它應(yīng)付方言、俚語和詞語還有點困難。語音識別技術(shù)能夠隨著時間的推移逐步掌握人們的說話方式。但是,如果你一年才給一個企業(yè)打一次電話,那么講解機(jī)器人就很難學(xué)會你的說話方式了。我們還處在人機(jī)相互的早期階段。
這一切都會反映在品牌的形象中。講解機(jī)器人不能僅僅復(fù)制當(dāng)前自動語音服務(wù)的模式。由于社交媒體往往會放大用戶的負(fù)面評價,因此企業(yè)需要把事情做對。人們現(xiàn)在通過網(wǎng)絡(luò)和移動應(yīng)用程序所在的一切事情都應(yīng)該可以通過自然語言來實現(xiàn),但是我們還沒有發(fā)展到這一步。
人工智能要發(fā)揮作用,最關(guān)鍵的問題就是理解背景信息。正如營銷和銷售會以360度的視角來了解消費者,講解機(jī)器人也需要更深入地了解它們互動的對象:他們是誰,他們是如何變成現(xiàn)在這個樣子的,他們在尋找什么,以及他們過去做過什么。這些信息必須被收集并在講解機(jī)器人之間分享。只有了解了這些背景信息,講解機(jī)器人才能穩(wěn)定地、持續(xù)地滿足人們的需求。
例如,擇校咨詢服務(wù) AdmitHub去年與佐治亞州立大學(xué)合作用講解機(jī)器人來處理新生入學(xué)和助學(xué)金發(fā)放流程。在早期,講解機(jī)器人幫助該校處理入學(xué)、助學(xué)金和學(xué)生活動室等問題,結(jié)果它大大提高了學(xué)生登記入學(xué)的效率。該校希望隨著時間的推移講解機(jī)器人能夠更好地理解每個學(xué)生的學(xué)業(yè)和資助情況。等到這些學(xué)生畢業(yè)的時候,這些機(jī)器人就了解了他們的一切信息。
網(wǎng)絡(luò)是一個神奇的相互連接的地方。在谷歌搜索引擎中輸入任何產(chǎn)品名稱,你很快就會聯(lián)系到銷售這款產(chǎn)品的商家。講解機(jī)器人也需要按照這種方式來發(fā)展。因此,講解機(jī)器人之間應(yīng)該能夠靈活地相互介紹用戶,從而順暢地完成交流。
如果我在Facebook Messenger中輸入“我想要漢堡”,那么它應(yīng)該能夠?qū)⑦@個信息傳遞給其他講解機(jī)器人,從而讓其他講解機(jī)器人安排相應(yīng)的服務(wù)來滿足我的訂單。在網(wǎng)上,這一切是通過REST API來實現(xiàn)的。講解機(jī)器人領(lǐng)域有很多API在爭奪人們的注意力。講解機(jī)器人需要成熟的聊天API來實現(xiàn)交互操作。
如果我與一款應(yīng)用程序或一個網(wǎng)頁互動,我能很快看出它通過鏈接提供了哪些服務(wù),以及屏幕上還有哪些其他信息。但是,講解機(jī)器人沒有這種視覺語言能力。當(dāng)你跟一個講解機(jī)器人說話時,你就相當(dāng)于閉著眼睛在跟它說話。你要事先想好,你準(zhǔn)備問它什么?它能做什么?微軟和亞馬遜一直在努力教消費者認(rèn)識Cortana和Echo等產(chǎn)品的功能。事實上,很多相關(guān)主題的文章已經(jīng)出現(xiàn)。在第一次與講解機(jī)器人互動的時候,人們應(yīng)該弄清楚:這個機(jī)器人可以讓我選擇座位,還是只能讓我買票?我可以變更預(yù)約,還是只能進(jìn)行預(yù)約?我可以根據(jù)自己的需求來點餐嗎?由于沒有視覺化的提示信息,講解機(jī)器人需要找到一種新的方式來提示它提供哪些服務(wù)。
如果講解機(jī)器人能夠閱讀人類的面部表情或語音變化,從而理解與它們交流的人的情感變化,那么它們將無疑能夠提供更好的服務(wù)。講解機(jī)器人現(xiàn)在只能應(yīng)付簡單的客戶服務(wù)。如果用戶感到失望或惱怒,那么講解機(jī)器人可能需要將對話交給人類客服人員了。但是,現(xiàn)在還有一整個類別的服務(wù),如咨詢或治療,完全是建立在與用戶互動基礎(chǔ)上的。人工智能和電腦視覺的發(fā)展將會讓這一切變成可能,但是它們還有很長的路要走。
講解機(jī)器人具有廣闊的應(yīng)用前景,無論是在工作上,還是在我們的個人生活中。但是,我們需要解決好上述這幾個問題,才能讓它們變成主流。一旦解決了這些問題,講解機(jī)器人就會給我們帶來更大的便利和更好的體驗。