本文圍繞阿里達摩院的十大科技趨勢預測,多維度分析了感知智能與認知智能這兩個概念。
日前,阿里巴巴達摩院對外發布2020年十大科技趨勢,「人工智慧從感知智能向認知智能演進」這一趨勢位列榜首。
何為感知智能與認知智能?
業內普遍認為,人工智慧的主要發展方向包括運算智能、感知智能、認知智能:
運算智能,主要指快速計算和記憶存儲能力。
感知智能,即視覺、聽覺、觸覺等感知能力。人和動物都具備,能夠通過各種智能感知能力與自然界進行交互。
例如,自動駕駛是通過激光雷達等感知設備和人工智慧演算法進行駕駛信息計算,人臉支付是設備通過感知人臉數據信息進行身份確認。機器在感知世界方面的優勢在於主動感知,因為機器可以充分利用DNN和大數據的成果。
認知智能,即「能理解會思考」,擁有處理複雜的事實和情形的能力。認知智能的發展分為三個層次:
- 第一層是語言理解
- 第二層是分析、推理
- 第三層是人格和情感
從感知智能發展到認知智能的必要性
達摩院發布的趨勢報告指出,人工智慧已經在「聽、說、看」等感知智能領域達到或超越了人類水準,但在需要外部知識、邏輯推理或者領域遷移的認知智能領域還處於初級階段。而認知智能,則是未來人工智慧熱潮能否進一步打開天花板,形成更大產業規模的關鍵因素。
以公安行業為例,人臉識別只是讓機器能夠識別出身份,但是涉及到偵查、破案,就需要梳理大量的線索,推斷出可能的結果,這僅靠感知智能是無法完成的。
認知智能的出現,使得人工智慧系統不再只是簡單的數據統計擬合,而是主動了解事物發展的背後規律和因果關係。認知智能可以幫助機器跨越模態理解數據,學習到最接近人腦認知的「一般表達」,獲取類似於人腦的多模感知能力,進而帶來顛覆性的產業價值。
從感知智能到認知智能的進階路徑
達摩院認為,認知智能將結合自然語言處理、跨領域知識圖譜、因果推理、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,進而實現感知智能到認知智能的關鍵突破。
自然語言處理技術和知識圖譜是認知智能階段技術發展的基石。在這個大趨勢下,率先布局自然語言處理和知識圖譜的企業將在認知智能時代具備強大的競爭力。
機器的學習需要基於文本進行,但機器對文字的理解存在巨大的技術難度,文本在不同場景中的處理方式也不盡相同,文本中蘊含的價值一直難以得到有效利用。
自然語言處理技術的作用,通俗地說,就是把自然語言轉化成機器能夠理解的符號,構建機器理解知識的基礎。
當攻克的自然語言識別後,才可以將不同行業的數據連接起來,甚至將線上和線下的數據打通,為人工智慧構建知識庫做準備。
認知智能的發展離不開自然語言處理和知識圖譜,因此掌握這兩項核心技術的企業,自然能獲得更大的價值。
國內認知智能布局情況及發展現狀
目前市場上,認知智能技術的公司更多是基於自身業務轉型,主要可以分為兩大類別,一類是從大數據分析公司轉型,如明略科技、百分點等;另一類是語音或者語言聲學的公司,如科大訊飛、思必馳、雲知聲、快商通等,這類公司大多以語音識別、聲紋識別為主。
例如,科大訊飛以感知智能+認知智能為企業的主要研究方向。
其感知智能的目標是,實現高可用的感知智能,讓機器有更多感知能力;任務包括語音識別、手寫識別、圖像識別等。
認知智能的目標是,實現認知智能的突破,部分取代人類的腦力勞動;其任務包括智能客服、自動閱卷、人機交互等。
另一家中國AI企業快商通,以聲紋識別等智能生物識別技術建立感知智能「智能生物識別大腦」,以自然語言處理等技術建立認知智能「艾賦能大腦」,其目標是希望機器能夠以語音和語言為入口,通過認知智能訓練出不同領域的專家系統,進而賦能到整個社會。
當感知智能出現乏力時,認知智能的出現可以將產業升級拉到快車道。如今技術壁壘還在攻克,通用的認知智能技術尚不可應用在各行各業,但在細分領域,認知智能已經能夠商用落地。
在公安領域,認知智能通過對犯罪者行為特徵進行提取和模式分析,並可以開發出一套犯罪預測的AI模型,一定程度上提高社會安全事件的預警能力和對風險態勢的感知。落地案例可參考快商通聲紋綜合作戰平台、明略數據大數據研判系統等。