情感到底是如何被機器計算?情感智能的商業化是否靠譜?我們希望帶著這些令人好奇問題深入到情感智能的最前沿。
在初為父母的前幾年時間裡,你們會有一件其樂無窮的事情就是觀察孩子們的情感狀態。小孩子的情感的豐富度是隨著大腦的日漸發育,還有生活經驗,尤其是父母的情感和情緒表現而逐漸發展的。
細心觀察就會發現,孩子們會由最開始的本能的哭泣、開心,慢慢流露出生氣、著急、疑惑和好奇,個性開始展現。再然後她便開始學著模仿大人的表情,表現出委屈、憤怒、不情不願、悲傷、害怕,也表現出興奮、淘氣、使壞得逞后的得意、裝模作樣被發現后的狡黠……
在個性、言語和情緒掌握上,父母很大程度就像是孩子的鏡像,孩子就是父母的印刻。幾乎每個家庭都在用自己的方式培養這樣一個「純人工智慧」。
世界級神經科學家安東尼奧·達馬西奧在其著作《笛卡爾的錯誤》中指出,情緒和情感也是人類理性的基礎,情緒部分的缺失使得理性決策難以實現。簡單來說,人類的理性不僅僅由智商(IQ)決定,也受情商(EQ)決定。
這一研究解釋了人類的智能不是簡單的邏輯計算和推理,還有情緒感受推動著的決策和行動。那麼,對於人工智慧而言,僅僅具有分析和識別能力是遠遠不夠的,能否具有情緒情感的識別和表達能力才是向人類智能的大步飛躍。
正如馬文·明斯基所言:「如果機器不能夠很好地模擬情感,那麼人們可能永遠也不會覺得機器具有智能。」
如何讓機器具有識別、理解和表達人的情感的能力,其實也早已進入人工智慧研究的視野之內。
在1997年,MIT媒體實驗室的AI專家羅莎琳德·皮卡德教授已經正式提出「情感計算(Affective Computing)」的概念,也同時開創了計算機科學、神經科學和人工智慧學科結合的這一分支學科——情感計算,從而推動了情感識別分析與AI技術相結合的情感智能的持續發展。
我們知道最近十年裡AI技術的爆發,主要是在計算機視覺、自然語言處理、語音識別等機器學習和深度學習演算法領域發生的。圖像識別、語音識別等AI應用在產業的成熟落地,其風頭正勁的光芒遮蓋了仍處在探索當中情感智能的發展。同時,這也說明情感智能是下一階段更高階的AI技術,其成熟度和應用場景還需要更多時間來培養。
根據德勤最新一份研究報告,作為2020年後新技術趨勢的情感智能,將成為很多人重新體驗AI技術的新方式之一。
也就是說,情感、情緒,這一原本專屬於人類個體的獨特而又複雜的內在屬性,正在成為被技術模擬和商業重構的生產力形式,現在以人機交互的方式來到我們身邊。
那麼,情感到底是如何被機器計算?情感智能的商業化是否靠譜?我們希望帶著這些令人好奇問題深入到情感智能的最前沿。
情感情緒識別,實現情感智能第一步
在搞清楚情感計算和情感智能之前,搞清楚情感概念本身就是一個非常複雜的問題。據統計,關於情感的研究和定義,相關的理論就有150種之多。我們可能很輕鬆地認出他人神態、語氣、姿勢當中包含的當下情緒和持續的情感狀態,但是讓我們說清楚到底什麼是情感,不同狀態、不同程度的情感的細微差別,可能就非常難了。
那麼,在識別情感情緒這件事情上,機器可以做的比人類更好嗎?
我們可以肯定的是情感是可以計算的。從性質上,情感其實可以區分為生理上的和心理上的兩個部分。前者體現為表情、音調、身體姿態以及依靠感測器才能覺察的肌肉、心電反應;後者體現為個體的內在的心理狀態,前者是後者的生理性表現,後者又是前者的心理基礎。
顯然,機器更擅長從前者的角度來識別和認知情感情緒。在情感計算的研究中,情感情緒識別是最基礎,也是最重要的研究領域。
情感情緒識別主要就是通過對人的面部表情、語音語調、文本內容以及身體生理信號等各種模態數據的學習,從而識別出人類的各種情緒和情感狀態。在此基礎上,現在情感計算領域已經具有很好的人臉表情識別、語音情感識別、文本情感識別、多模態情感情緒識別等。
以人臉表情識別為例:表情識別技術就可以利用人臉的面部信息,比如眼角細紋、眉頭、嘴角位置的變化,來進行表情的判斷。由於深度學習的應用,表情識別的演算法也取得了很大的提升。現在研究者更是將注意力集中在人類難以察覺的微表情識別當中。這些在美劇當中出現的技術將實際應用到司法、金融以及教育領域。
人臉表情識別技術不僅能知道人們是否是發自內心的微笑還是社交微笑,還能夠抓取到連本人都意識不到的、轉瞬即逝的表情,儘管這些表情是本人刻意隱藏的或者無意識流露出來的。
除人臉表情識別外,語音情感識別是一種同樣重要的情感識別方式。語音情感的識別演算法是通過對聲音信號的特徵提取、處理,實現分類器所需的訓練模型,利用分類器來對要識別的情感類型進行預測。
在人機的語音情感交互中,除了機器準確地獲取和識別人類的語音情感信息,再就是機器如何使用帶有情感的語音信息進行反饋。
目前來看,我們在智能音箱、智能導航上聽到的那些四平八穩的機器合成仿人類語音,距離有著韻律和節奏感的真人音色和情感表達上還是有一定差距的。但是在遷移學習、強化學習等方法的幫助下,模模擬人帶有真實情感的語音語調的合成語音,其以假亂真的程度已經超出了我們的想象。很多在線客服,僅從聲音上已經很難判斷是人工還是人工智慧了。
基於文本的情感識別,儘管沒有了圖像、語音等維度的個性化數據信息,但通過自然語言處理,機器增加了對話、語句、語詞屬性等多個層次的語義分析。從對話中可以獲得對方的情感傾向,從語句中獲得其情緒的轉變,從語詞屬性中提取觀點。這樣在機器進行文本應答的過程中,就可以給出更個性化的回復,而不是像現在電商客服里清一水的感謝或者道歉的標準文案。
多模態情感情緒識別,相比較於單模態的數據識別,可以綜合不同模態的情感信息來提高情緒情感識別的準確度。
首先是智能終端設備,包括像智能手錶、VR眼鏡等可穿戴設備的成熟,使得多模態數據收集成為可能。其次,研究者已經可以採用深度信念網路對生理信號、表情與姿勢信息以及語音信號等多模態信息進行特徵融合,再通過支持向量機來進行特徵分類,從而給出情緒情感識別的結果。
情感情緒識別只是邁出了情感計算最基礎的一步,當AI開始嘗試給出帶有情感表達和情感決策的反饋,人機的情感互動才可以建立起完整的閉環。當然,由於商業活動當中,有大量的場景需要應用到對於人類的情感情緒識別技術。
伴隨著這些情感計算的情感情緒識別技術開始的出現,其商業化進程就已經開始,特別是近幾年伴隨著AI應用的大規模普及,情感智能正成為了AI領域的新熱點。
新交互體驗,情感智能的商業新機
隨著情感計算技術的成熟,人臉表情識別、語音文本識別、人機情感交互已經在零售、金融、教育、臨床醫學、心理分析、車輛監控等商業領域得到了廣泛的應用,湧現出一大批以情感計算技術為核心的創業公司。在眾多的商業場景中,客戶或者用戶的情感情緒對於企業來說是非常重要的參考數據,也是企業進行決策的數據。
比如,廣告主希望知道消費者對於他們的廣告宣傳的關注點和感興趣的程度;零售商希望知道進店顧客對於陳列商品的喜好程度;教育工作者希望了解授課過程中學生們的學習狀態和對知識的興趣態度;在線客服則希望最及時地處理顧客的負面投訴,想儘快地識別和安撫那些已經氣急敗壞的客戶以降低投訴風險;金融業則希望了解重要客戶的誠信情況,除了其歷史記錄,還想知道其當前的真實意圖……傳統的調查、訪談或者增加人力的方法,儘管有一定作用,但仍然存在著大量的主觀的、不確定的影響因素來影響企業對客戶情緒的有效判斷。而基於情感智能的識別分析,則能夠得到客戶和用戶最真實的情感表現,同時由於機器學習的大規模應用,還能有效降低在情感計算上面的時間、人力的投入。
在廣告效果測試中,如果是基於問卷調查,被測試者往往會經過理性思考,出於維護個人形象或者出於社交禮貌等因素,給予被測試廣告過高的評價。而基於人臉情緒識別,則可以發現被測者在觀看廣告時的無意識的情緒狀態,這樣更有助於得到對該廣告的真實反饋。
再比如零售門店的場景當中,遍布門口以及店內的攝像頭,可以代替店員最先捕捉到顧客的瀏覽狀態、在商品前的停留時間、神情狀態等信息,從而可以有效指導店員進行服務介入。另外,與會員制的結合,可以對該顧客的購買記錄、到店的情感狀態記錄一起形成顧客的個性化資料庫,從而進行更有針對性的購物指導,提高到店復購率。
在金融領域,情感智能可以有效應用在金融信貸反欺詐領域。在應用這些技術之前,金融機構只能根據信貸客戶的歷史表現和資產信息進行判斷,這樣一方面限制了信貸的客戶群體,一方面有可能遭遇客戶的類似「龐氏騙局」形式的故意欺詐,即通過之前良好的信貸記錄,最後一次性大額信貸后捲款跑路。
基於情感智能技術的實時性和分析數據的「不可偽造」特性,金融機構就可以通過對信貸客戶在面對面訪談過程中的人體數據進行音視頻的記錄和分析。基於對這些數據的分析,可以形成一個欺詐可能性的概率,為金融機構的最終判斷提供參考依據。
如果將這些應用場景列舉下去,我們會得到一串長長的情感智能的商業化清單。我們其實也能看到,從商業機構、企業主的角度出發,他們想要將情感智能技術應用到各類商業場景當中,從而獲得更多的消費者數據和商業機會。
作為消費者和一些平台用戶的我們是否該問一句:在這些應用場景當中,是否要訂立一些使用的邊界,來保護我們個人最後的那一點隱私呢?
知情和許可,打開情感智能商業化的正確姿勢
情感計算和情感智能的技術可行性以及應用的可行性,其實已經毋庸置疑了。但是情感智能的應用邊界和規則,卻理應得到認真的思考和界定。思考這樣幾個場景,比如:當你在駕車行駛的途中,車內攝像頭可以捕捉到你的面部表情,就會判斷你是否處於疲勞、分心或者路怒狀態,並進行及時的提醒和休息建議。
這項技術現在早已開始普及,但是如果這些被記錄的情緒狀態,如果被用來作為你下一次車險的判斷依據,就需要值得商榷了。
再比如:去年一段小學生戴著監控頭環上課的事件鬧得沸沸揚揚。這一設備可以記錄孩子們的走神、分心的情況,並進行注意力打分,彙報給老師和家長。這種情緒數據的監控,以及類似地對學生上課狀態的識別,是否對學生的隱私造成侵犯和傷害,也是一件值得探討的事情。
更極端的情況,比如一些公司如果想用這套情感智能系統來監控員工的工作表現,社交網站和分析機構使用用戶的社交記錄來進行政治傾向的篩選和政治選舉的刻意引導,正如Facebook和劍橋分析所做的那樣,造成了極為惡劣的社會影響。
顯然,商業機構或者各類組織在應用情感智能的技術時候,應該讓消費者和使用者擁有充分的知情權,並且在某些情況下,要徵得用戶的許可授權,這樣才能更好地為情感智能的應用提供友好的使用環境。
首先,提供知情權是所有應用情感智能的基礎。比如,零售場景的視頻監控和數據監控應做好明顯的提示;在線客服的機器客服應答,也應明確告知其真實身份。
其次,某些場景下獲得消費者和用戶的許可授權,是進行情感智能的必要步驟。比如:廣告商想要獲取用戶的真實反饋,比如在智能電視、影院等場景,必須獲得觀眾用戶的許可,才可以進行數據採集和分析。另外,從公共安全和公民個人隱私保護的權衡利弊上,國家也應該開始制定相應的法律法規,限制情感智能在可能會涉及的危害公共安全和個人隱私領域的應用。
我們知道商業機構以及各類組織在新技術、新商業模式上的探索熱情是難以遏制的。情感智能所產生的商業新場景,將激發全新的人機交互場景,但這同時意味著個人用戶必須讓渡自己的更為私密的隱私數據。
按照科斯定理,一項資源歸誰所有,不在於它是屬於誰的,而是在於誰用得好就歸誰所有。這一理解確實很好地解釋了資源在市場中如何最高效利用的背後原因。比如:薛兆豐所列舉的淘寶的購物大數據以及亞馬遜的註釋的數據,由於是淘寶網站的廣告平台以及亞馬遜的數據平台可以用得最好,這些數據就應該歸淘寶和亞馬遜所有。
當然這有一定道理,畢竟用戶們免費使用了平台提供的一系列服務,並且肯定同意了平台的那些「冗長的」用戶服務協議,讓渡數據才能更好地幫助平台成長。
但是現在情感智能技術的進展要開始獲取個人幾乎最私密、最主觀化的身體和心理數據,這必須讓我們重新審視一下科斯定理的適用範圍了。
用戶是否在意自己的這一隱私數據是一回事情,商業機構是否提供情感智能應用的知情權和許可權就是另一回事。至少像手機APP應用在安裝的時候,也要問一句,是否同意獲取您的個人情緒情感信息。
情感智能的商業野心之下,還請讓選擇權留在用戶的手中。
#專欄作家#
腦極體,微信公眾號:腦極體,人人都是產品經理專欄作家。
本文原創發佈於人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash, 基於CC0協議