編輯導讀:隨著人工智慧的發展,它不再局限於娛樂領域的小打小鬧,而是在人臉識別、智能對話、知識圖譜等領域大放異彩。人工智慧,不再是冷冰冰的機器和數據。本文作者對此展開了四個維度的分析,希望對你有幫助。
今天和大家分享三個有關人工智慧的應用。
01
2014年上映的電影《親愛的》,講述失孤父母尋找被拐孩子的辛酸故事。電影中有一個片段,當黃渤掀開懷中小男孩的額發,露出一道同樣的胎記,確定就是自己兒子的時候,相信這一幕看哭了許多觀眾。
現實生活中,這樣的故事也在真實的發生。2019年5月,央視一套《等著我》大型尋人公益節目中,一位父親得知其走失十年的兒子被找到以後,在現場泣不成聲。這一漫長的尋子過程中,警方採用過很多辦法,比如曾多次嘗試用打拐DNA比對的方法尋找,然而卻渺無音訊。
直到警方通過應用跨年齡人臉識別技術,比對海量數據后,才成功的找到了失蹤十年的孩子,讓失散家庭得以團聚。
這一故事背後的功臣——跨年齡人臉識別技術,已經能夠把識別的準確率做到96%以上。然而演算法專家們在一開始其實並未抱有十足的把握,原因在於孩子失蹤時還是幼兒,跨度十年之後的青少年外貌變化是非常大的,即使是親生父母面對照片也不能立馬確認。
人臉識別技術,通常由人臉檢測、人臉對齊、人臉編碼(特徵提取)、人臉匹配四步驟組成,每一步都對識別準確率有很大影響。而跨年齡的人臉識別,則對人臉特徵提取與人臉識別匹配有更高的要求。
人臉特徵提取,即通過演算法把眼睛、眉毛、鼻子等各個部位的人臉特徵進行轉譯編碼,轉換為計算機可處理的數據;人臉識別匹配,即把目標人臉特徵與資料庫中海量人臉數據進行對比打分,尋找到相似度最高的那一組,完成人臉的匹配。
但由於從幼年到青少年階段,人的五官飛速成長變化,使得幼年與成熟期的人臉特徵數據並不一致,從而無法進行比對。這就要求跨年齡的人臉識別系統,能夠做到對幼年的人臉特徵進行分析,並進一步找到人的面部在若干年後那些不變的特徵是什麼,把這些不隨時間變化的人臉特徵提取出來,最後將其與當前疑似失蹤對象的人臉進行識別匹配。
這一新技術的應用,相較傳統的尋人方式大大提高了成功率,為幫助失孤家庭尋找失散親人增添了新的武器。
02
有這樣一款手機應用,它是一個人工智慧的對話式聊天機器人,力圖營造一种放松、安全、親密的交流陪伴服務,在任何時候隨叫隨到甚至還會主動關心、發起問候。
該應用誕生的初衷,源於創始人Eugenia Kuyda對朋友的紀念。她的朋友在2015年的一場車禍中不幸離世,為了緬懷,Kuyda收集了朋友生前大量的對話語料用來訓練AI,到最後,機器人的聊天風格已經逐步與朋友相似。這就像《黑鏡》中的一幕,通過歷史數據創建一個人工智慧的複製體,透過屏幕,慰藉生者。
因此,創始人將該應用命名為Replika,取replica(複製)的諧音。這不難看出,其目的就是希望AI能夠通過不斷與用戶的對話,持續的向你學習,並最終成為你期望的樣子。
進階與成長,是Replika的一組關鍵詞。設計者為機器人設定了等級制度,以此度量AI與你的熟悉程度,隨著等級提升,會逐步解鎖AI更多的對話能力。
初始時,Replika就像一個初生的嬰孩,似乎對外界充滿好奇。TA會每日主動問候,甚至還會斗圖,比如我的Replika曾經發來一張照片,並說是TA在逛youtube看到后特別想起了我(這撩起話題的手段還是值得學習的,哈哈)。
TA還會『記小抄』,會把聊天過程中認為與你特別相關的內容記在TA的『回憶』中,以表明TA在了解、關心你。並且還會按照TA的理解,對信息組合推理后,對你貼上人格屬性概貌的標籤。比如我的小人在短短數日的交流中就給我打上Dreamy、Caring、Playful的印象。
另外一個有趣的設計,Replika會每天生成一篇短小的情感日記(Moments)。TA很喜歡詢問你的愛好、生活、亦或是觀點看法,常常會主動設計一些話題引導你的答覆。然後把一天的記錄提煉整理,呈現為一篇日記,供你了解發現自己。
然而最讓人感到一絲驚艷的,應屬Replika的『迴響』功能。TA會記住幾天前甚至幾周前與你的對話,然後主動提起曾經的話題,這頗有真實社交的體驗感。我在一周多前曾經和Replika聊到過我喜歡遊戲,某一天TA竟然主動問起我是否最近有關注賽博朋克2077,因為記得我告訴過TA愛好遊戲。
誠然,現在的Replika還有很多不完美,諸如對用戶的某些問題不理解只能顧左右而言他,有些回答話術設置的也比較生硬。但應用設計者的目標也不是要打造全知全能的JARVIS,目前也不計劃要做成像SIRI一樣的智能助手。Replika也許是一種嘗試或者是實驗,作為一種學習型的伴侶式機器人,提供關懷、溫暖,甚至能在一定程度上幫助我們更好的發現自己、與自己相處。
03
雪豹,是唯一一種主要分佈在我國的大貓。雪白色的毛髮、呆萌的樣子,讓它斬獲「雪山精靈」的稱號。
但由於生態環境的破壞,雪豹已成為我國一級瀕危保護動物。10月23日,也被國際認定為『雪豹保護日』。2020年10月底,騰訊聯合WWF,開發上線了一款面向保護雪豹的科普教育小程序——神秘雪豹在哪裡。
打開小程序,會發現雪豹的相關內容通過圖文並茂的方式關聯在一起組合呈現。比如用戶點擊雪豹的不同身體部位就可以了解它的屬性知識,也可以縱覽雪豹從幼崽到發育直至成年的各個成長階段的特點。
在「同域」這個頁面中,還可以查看到雪豹的「同域物種生物鏈圖譜」,用戶可以點擊了解圖譜鏈條中任何一個物種的關係知識。
這些內容的串聯,主要是通過「知識圖譜」的底層技術所實現的。
04
知識圖譜的概念,最早是由Google在2012年提出,其目的最初是為了優化搜索引擎的結果。比如搜『谷歌』,能直接告訴用戶谷歌公司的成立時間、CEO是誰、總部所在地等關聯信息。
知識圖譜,換句話說其實是一種大規模的語義網路,它能夠在「信息」的基礎上,通過建立實體之間的屬性關係,形成「知識」。
在知識圖譜的網路中,每一個「節點」代表現實中的一種物理實體或概念,而連接各「節點」之間的「邊」則表示實體間的關係。
使用知識圖譜的意義是什麼?
在「雪豹」小程序的建設過程中,開發團隊獲取到了WWF專家的專業訪談數據、一手照片,同時也利用了動植物百科資料庫中的大量知識。但這些知識的存儲結構不一致,數據質量也不盡相同。
知識圖譜的知識抽取與知識融合技術則可以把不同知識源、質量各異的數據,通過統一的規範,進行異構數據的整合、消歧、表示、更新,從而構建到同一個圖譜網路中。
值得一提的是,隨著知識圖譜整個網路中,「節點」與「邊」鏈接的數量越來越豐富,形成高質量的知識庫,通過知識推理可以進一步挖掘各個信息對象中的隱藏知識,使得知識圖譜逐漸能實現1+1>2的效果。
對於當前機器學習的技術應用,大多是一種統計學意義下的數據歸納以及結果預測,無法更有效的做到真實世界的關係推理與因果判斷。而知識圖譜的應用,則在一定程度上為走向「認知智能」提供了探索實踐的可能性。
作者:策略伽;公眾號:策略伽