透過一段歷史，來回答我們為什麼需要手機AI | 人人都是產品經理

現在，越來越多的廠商和開發者正在加入手機AI這一領域，越來越多的用戶也在關注手機AI。那我們為什麼需要手機AI？到底期待什麼樣的AI體驗？

我們已經討論過很多有關手機AI的問題，半年過去，我們很高興看到越來越多的廠商和開發者加入這個大命題，越來越多的消費者開始關注AI。同時，移動AI的相關平台、解決方案和黑科技也在開枝散葉。

智能手機的歷史上，曾經出現過很多令人激動的時刻。而AI的加入，顯然正在醞釀下一個。

要知道，手機AI的出現和發展，並不僅僅完成了手機某部分的進化。

在晶元、演算法、開發平台，以及硬體、軟體、感測設備等要素的協同進化下，我們接下來很可能見證一場，人與移動設備共存方式的長久改變。從攝影、遊戲、翻譯這樣的手機固有功能，到旅行、商務、家庭這些與每個人密不可分的生活方式，都可能被手機AI帶來的衝擊所改變。

然而，在對未來滿懷好奇的時候，手機AI的相關賽道也開始出現擁堵，甚至混亂。很多「AI擦邊球」開始出現，劣幣效應若隱若現，也不免讓心底泛起憂慮。

於是我們似乎應該來回答一個問題：到底我們為什麼需要手機AI？手機AI又有哪些必要條件？

想要回答它，讓我們回到那久遠的過去——幾個月之前。

「史」前時代：手機開始嘗試人工智慧，以及遇到的問題

雖然手機AI，這件事大舉躍入公共視野，僅僅是幾個月之前的事。但恐怕我們想要搞明白這次相遇，還要再把時間倒回去一點，也不多，七十年吧。

自1951年，會議確定了AI概念開始，學術界對人工智慧運算的期許，始終都可以總結成三件事：像人類一樣對話；用如同人類的眼鏡識別萬物；如人類一樣推理和思考。

為了這三個目標，計算機科學和數學界努力了幾十年。發明了從邏輯到專家系統，再到機器學習的各種解決方案。

有意思的是，在智能手機徹底佔領人類生活方式之後，這三個「小目標」剛好能滿足手機下一步進化的需求——對話操作。可以抵消觸屏操作中的不便、機器視覺技術，可以讓手機的拍照、視頻和圖像處理更多元。而基於多元數據的機器學習，可以讓手機開始理解用戶的習慣和需求。

從這個邏輯上看，智能手機的下一步幾乎肯定是AI。但怎麼跨入AI的大門，對於手機產業來說卻並不是那麼容易解決的問題。

其實早在移動AI晶元出現之前，各種手機探索AI的方式已經陸續誕生，或許這個可以稱為手機AI的「史前時代」。

比如說：蘋果手機一度以語音助手Siri掀起了浪潮，而Siri的不斷進化，基本是靠AI的語音交互和語義理解能力來實現的。最早的Siri是個問答模板，而AI的加入讓ta不斷變得「聰明」起來。

再比如：蘋果手機，很早開始探索的圖片識別和標籤分類，也是利用了AI的圖像理解技術來實現。

在語音和圖像之外，AI理解用戶這件事也被嘗試了出來。

2016年，榮耀發布了榮耀magic，首次探索了利用AI技術，主動理解用戶信息，提供主動服務。

除此之外，AI還隱藏在手機的更多角落。比如：很多雙攝解決方案中，都需要用AI的空間演算法來優化拍照效果。

但以上這些探索，卻不約而同遇到了問題：AI的神經網路和卷積運算模式，不同於傳統的運算和圖像處理任務。用CPU+GPU的傳統移動運算模式來處理比較吃力，還要大量耗能。

就像上文所說蘋果的圖像分類，由於讓手機識別圖像的運算非常緩慢，必須要依託雲計算來完成，所以蘋果選擇在夜晚進行分類處理。對於用戶來說，這種隔一天才能完成的運算當然體驗很差。

AI很好，但運行AI很慢很耗電，在2017年之前差不多是手機產業的共識。

那麼，解決方案是什麼呢？

萌芽紀元：從AI晶元開始一切

差不多所有技術發展史上，關鍵節點的技術突破，都會成為撬動整個行業的「勝負手」。燃油機之於輪船、汽車；交流電之於照明和電器設備，莫不如是。

對於手機AI來說，既然CPU、GPU來承擔複雜的AI計算任務不靠譜。那解決方案，當然是單獨做一個基於深度學習和神經網路的AI專項處理單元。

其實類似的雲計算晶元解決方案已經很多，但在2017年年中的時候，外界還是普遍不看好這類技術可以在移動終端實現。

清楚記得去年7月，一位同行還跟我抬杠。他言之鑿鑿地告訴我，以他報道晶元十年的經驗，AI移動晶元五年內都不可能出現。

好吧，最後打臉的不是我。

去年9月2日，華為率先發布了世界首款搭載AI任務專項處理能力的移動晶元——麒麟970，它的最大特點顯然在於它在CPU、GPU兩個通用處理單元之外，加入了AI處理單元NPU（Neural network Processing Unit，神經網路單元）。

由於利用了深度學習處理技術，NPU可以比其他處理模式，更快地處理卷積、遷移等深度學習任務，也就可以達成更快的AI任務處理能力。

9月13日，蘋果在發布iPhone X時發布了A11晶元。

A11集成了一個專用於處理AI任務的運算單元「神經網路引擎(Neural Engine)」，開啟了iPhone的AI之路。

隨後到了10月，華為發布了搭載麒麟970的旗艦機——華為mate10，在攝影、圖片識別和用戶服務幾個層面展開了AI攻勢；而榮耀也緊隨其後，發布了搭載麒麟970的V10；剛剛發布的華為P20也以此為基礎，創造了DxO攝像頭評測的分數新高。

目前來看，華為、榮耀、蘋果的主流旗艦產品，在今年都會搭載AI專用晶元，並以此作為產品功能創新的基礎，應該已經沒什麼疑問。

此外，谷歌在pixel2中，使用了在攝像頭區域安裝專用圖像處，處理單元ImageProcessing Unit（IPU）的解決方案；三星則希望以新的語音交互功能，帶來AI體驗。

整個移動AI賽道開始變得多元，但有一個共識，似乎已經在這場比賽初期就達成了——專用的處理能力，是AI體驗的基礎。

創生期的共識：AI為什麼需要終端計算？

無論是華為、蘋果還是谷歌，似乎都在一開始就認定了，先有AI處理單元，而後有AI體驗。

這到底是什麼道理？直到現在，很多手機評測和分析還是沒有搞清。

讓我們舉個例子：應該很多人都用過拍照識花功能，春天是個踏青的季節，這功能在今天可謂正當其時。但不妨回想一下，這個很有代表性的AI體驗，其實反應非常慢。各種識花軟體都要等上一會，假如網路不好還要等更久。

這就是因為圖像識別消耗算力較大，還要到雲端進行資料庫匹配，最終導致體驗並不是瞬時的。

其實，用CPU和GPU也都能處理AI任務，就像單CPU也能處理圖像任務一樣，問題是缺乏針對性算力，會導致能耗過高和大量延遲。

假如是識花倒也還好，畢竟這麼雅緻的事值得等上一等，但假如是直播中進行AI優化與識別，高延遲加高耗電不就太過分了？

這就是通過AI處理單元，在終端完成AI任務處理的第一個原因：提高處理速度，達成實時化，低耗能，並能夠處理複雜的AI任務。

另一方面，最近Facebook的數據泄露事件，鬧得沸沸揚揚。而此前谷歌、蘋果也都有關於資料庫泄露的問題出現。

在AI時代，用戶把聲音、圖像和視頻上傳給系統，完成識別與優化已經成為必然。但上傳到雲端，把自己的數據交給一個遠在天邊的伺服器，似乎有些不妥。

拍個花花草草當然還好了，但如果是自己與家人的照片和視頻，冒著隨時可能泄露的風險，上傳到雲端進行AI處理，估計很多用戶都會選擇放棄。

這就是手機必須搭載AI處理單元的第二個原因：終端處理，保證安全。

當然，雲端訓練機器，終端機器服務用戶的「雲端一體化」思路是更加合理的。但終端AI處理能力，是整個AI服務閉環中不可或缺，但也是最難攻克的一環。

除了上述兩點之外，近半年的手機AI創生史中，還有一件事是值得大家思考的。

那就是我們到底期待什麼樣的AI體驗？

再舉個例子：在去年華為Mate10發布了場景化拍照模式之後，今天小米mix2S也發布了宣傳話術都近乎一樣的功能。

相信不久的將來，還會看到更多場景識別拍照，最終這將成為今年主流機型的標配。

但AI真的只能如此雷同嗎？

回想一下喬布斯帶給智能手機的創意，最大的突破在於引入了APP模式，讓各種各樣的功能和體驗進入到同一部手機里。而AI原本應該是更多元化，更多想象力的技術邏輯，怎麼竟然變成了「天下是一家，抄我再抄他」？

開發一種AI演算法很容易（模仿就更容易），讓各種各樣的AI功能百花齊放卻有點難。

而這就是AI需要在終端完成計算的第三個原因：通過硬體提供通用AI加速能力，引進開發生態。

試想一下，假如手機AI算力支持，也不提供開放介面，只是自己搞了一些簡單AI功能。那一個開發者即使想出來特別牛的AI創意，基本也於事無補。

是拿少數幾個AI功能，賭消費者能否買賬，還是拿千萬開發者的創意能力，去賭AI生態的開花結果，顯然並不是特別難的選擇題。

所以，整個手機AI的從無到有，從蠻荒生長到萌芽勃發，基本可以看做是一個問題和一個回答：我們到底如何AI？

答案是：走最困難的路，搭建從晶元到平台，再到生態的邏輯閉環。

畢竟AI不是魔法，不能從空中結出果子。

作者：腦極體，微信公眾號：腦極體