「閑聊」短時間內還是需要產品驅動,而長時間則可能是依賴技術驅動。
現狀梳理
人機對話的發展還處在起步階段,音箱之間的大戰就是一個很好的開始,未來會有更多的設備被賦予對話的能力。
目前整個過程最大的問題在於自然語言處理(即NLP),在這個NLP中最不好處理的就是開放域的閑聊了,這也是無論那個公司的」對話系統(廣義上的語音交互設備所搭載的系統)「,都會出現答非所問的情況。
用戶體驗角度
1. 了解競品(這裡指狹義上的競品)
目前知名度最高的閑聊機器人就是小冰,小冰也是業內首個提出用「交互次數(即CPS)」來作為衡量閑聊質量的方式,而其他公司大多都還在用「單輪準確率」來衡量聊天的好壞,這裡最大的問題是評判標準過於主觀。當然也有公司以其他相關轉化率為目標,不在分析範圍內。
所以這裡主要分為:以提升CPS為目標的小冰和以提升單輪準確率為目標的其他公司。
2. 競品優劣
前面已經分析過了,各個公司的優化目標不同,所以他們出現的問題也會有所差異。
小冰:由於小冰以CPS為目標,所以導致小冰非常善於引導對話,也就是說小冰的主動性太強了,就像你有一個非常愛嘮嗑的朋友,時不時還帶著你一起跑題。帶來的問題就是小冰常常會回復的答非所問,讓人感覺不知所云。
還有小冰為了實現上下文的關聯性,他們聊天庫的語料是進行分類的,也就是當你談到某個話題時,他會在當前的聊天中,固定出現該話題的語料,使用戶感覺到一直再聊一個事情。帶來的問題就是和小冰閑聊很難跳出該話題,不能夠更靈活的應對用戶的反饋。
其他公司:那些重視單輪準確率的閑聊,單獨拿出來每句話看,給人的感覺是很難區分這是人還是機器人。但是整體一起看,很容易就能看出來,其中前後矛盾,指代不明的現象頻繁出現,很難堅持聊下去。
由於為了提高單輪準確率,最簡單的方式補充聊天庫,即Q-A語料。這時候的閑聊機器人是被動的,也就是你問他,他才會回復,當你不知道該說什麼的時候,對話就結束了。
綜合考慮,就用戶體驗的角度來講,CPS為目標更加客觀,更能滿足用戶的需求。
3. 潛在價值
閑聊無用論現在是大家的共識,這也是除小冰外,很少見大公司把這個當作核心來做。其實這主要因為沒有明確的商業模式,而且技術瓶頸明顯,但是市場規模還是很大的。因為聊天對話是人類的天性,每個人都需要一個可以說心裡話的人,目前技術是主要瓶頸,無法支撐開放域的自由對話,讓人感覺沒有人會和機器人聊天。
想要從閑聊的角度抓住用戶,那一定是要滿足情感的需求。
技術解決角度
面對開放域閑聊各種各樣的問題,也有各種各樣的解決方法,我按照自己的理解,大致分為三種方式演算法、正則、兜底。
1. 演算法
隨著深度學習的發展,演算法這個詞逐漸進入人們眼中,給人一種高深莫測的感覺,但是在自然語言處理中,所能起到的作用還是很有限的。按照回復方式,現在演算法主要分為:匹配演算法(計算兩個句子的是否匹配)、解析演算法(先給輸入進行分類,再按照預設類別回復)和生成演算法(直接生成回復)
匹配演算法:這應該是閑聊最重要的演算法了,主要是從海量聊天庫中找到相似的句子,和搜索用到的演算法較一致。
解析演算法:目前很多公司都用到了,主要就是通過模型對輸入進行分類,也是目前演算法的主流用法。
生成演算法:很少有公司用這類演算法,主要還是回復結果並不可控,據說中文版的小冰有10%的回復使用該演算法。
2. 正則
正則指得就是正則表達式,這是比較傳統的方式,雖然簡單,但是效果立竿見影。這種方式在技能上比較常見,我覺得正則即可以準確到完全匹配,也可以泛化到關鍵詞回復。
3. 隨機
所謂隨機就是不做任何解析,隨機回復我們預設好的回復。這往往用來解決超過機器人能力範圍時,給用戶的一個反饋。在明知無法滿足用戶需求的情況下,回復的話術就會很重要,不同產品需要不同的設計思路。
語言的本質
之前在一篇文章當中看到一個對語言本質的理解,說「語言時思維的映射」。也就是說如果你不會思考,那麼你的語言終究是假的,是存在於表面的。而現在的深度學習,也只是在利用大量的數據進行特徵提取,並沒有因果關係的推理,所以當前的深度學習在NLP領域,能力有限。而想要實現真正像人一樣的閑聊,還是需要一定的時間,短時間內無法速成。
未來展望
理解了閑聊的現狀,想象一下閑聊的未來,目前閑聊在對話系統中的位置可能如下:
1. 隨著人機對話的普及,會有越來越多的產品搭載對話系統,閑聊將長時間會作為一個」兜底「的存在,用來解決技能以外的輸入。當技能識別率和技能資源趨於一致的情況下,對話系統中的閑聊將會成為一個加分項的。
2. 閑聊如果可以收集到用戶畫像,那麼基於閑聊的推薦系統將會發揮很大的作用,這個需要根據不同的產品進行設計。如果做推薦,想到最好的入手點還是前面說到的情感,情感一方面可以造成用戶粘性,另一方面可以獲得用戶的信任。
我按照對語言本質的猜測,將閑聊未來的發展分成兩部分,分割線就是技術是否可以讓技術實現思考:
1. 閑聊短時間內還是需要產品驅動,而產品即需要了解當前技術瓶頸,也需要了解用戶需求,甚至需求背後的人性,還有閑聊在整個產品中的定位,才有機會提升閑聊的用戶體驗。
2. 閑聊長時間的未來可能是技術驅動,而產品只是一個輔助的角色。先進的技術可以讓機器人思考,調整相關的參數,就可以改變機器思考的方式,這個時候產品的作用就不再那麼重要。