數月前,我長途跋涉來到位於紐約州約克城高地的IBM研究實驗室的林間園區,為的就是能早早一窺那近在眼前卻讓人期待許久的人工智慧的未來。這兒是超級電腦「沃森」(Watson)的研發地,而沃森在2011年就在「危險邊緣」(Jeopardy!)節目的比賽里拔得頭籌。最初的沃森電腦仍留於此處——它是一個體積約與一個卧室相當,由10台直立的冷櫃式機器圍成四面牆的計算機系統。技術人員可以通過系統內部的小細孔把各種線纜接到機器背部。系統內部溫度高得出奇,彷彿這個計算機集群是活生生的一般。
如今的沃森系統與之前相比有了顯著差異。它不再僅僅存在於一排機櫃之中,而是通過大量對用戶免費開放的伺服器傳播,這些伺服器能夠即時運行上百種人工智慧的「情況」。同所有雲端化的事物一樣,沃森系統為世界各地同時使用的客戶服務,他們能夠用手機、台式機以及他們自己的數據伺服器連上該系統。這類人工智慧可以根據需求按比例增加或減少。鑒於人工智慧會隨人們的使用而逐步改進,沃森將始終變得愈發聰明;它在任何一次情況中所獲悉的改進點都會立即傳送至其他情況中。並且,它也不是一個單一的程序,而是各種軟體引擎的集合——其邏輯演繹引擎和語言解析引擎可以在不同的代碼、晶元以及位置上運行——所有這些智慧的因素都彙集成了一個統一的智能流。
用戶可以直接接入這一永久連接(always-on)的智能系統,也可以通過使用這一人工智慧雲服務的第三方應用程序接入。正如許多高瞻遠矚的父母一樣,IBM想讓沃森電腦從事醫學工作,因此他們正在開發一款醫療診斷工具的應用程序,這倒也不足為奇。之前,診療方面的人工智慧嘗試大多以慘敗告終,但沃森卻卓有成效。簡單地說,當我輸入我曾經在印度感染上的某種疾病癥狀時,它會給我一個疑似病症的清單,上面一一列明了可能性從高到低的疾病。它認為我最可能感染了賈第鞭毛蟲病(Giardia)——說的一點兒也沒錯。這一技術尚未直接對患者開放;IBM將沃森電腦的智能提供給合作夥伴接入使用,以幫助他們開發出用戶友好界面為預約醫生及醫院方面服務。「我相信類似沃森這種——無論它是機器還是人——都將很快成為世界上最好的診療醫生」,創業公司Scanadu的首席醫療官艾倫·格林(Alan Greene)說道,該公司受到電影《星際迷航》中醫用三錄儀[2]的啟發,正在利用雲人工智慧技術製造一種診療設備。「從人工智慧技術改進的速率來看,現在出生的孩子長大后,很可能不太需要通過看醫生來得知診療情況了。」
醫學僅僅只是一個開始。所有主流的雲計算公司,加上數十家創業公司都在爭先恐後地開展類似沃森電腦的認知服務。根據量化分析公司Quid的數據,自2009年以來,人工智慧已經吸引了超過170億美元的投資。僅去年一年,就有322家擁有類似人工智慧技術的公司獲得了超過20億美元的投資。Facebook和谷歌也為其公司內部的人工智慧研究小組招聘了研究員。自去年以來,雅虎、英特爾、Dropbox、LinkedIn、Pinterest以及推特也都收購了人工智慧公司。過去四年間,人工智慧領域的民間投資以平均每年62%的增長速率增加,這一速率預計還會持續下去。
縱觀所有這些活動,人工智慧的未來正進入我們的視野之中,它既非如那種哈爾9000(HAL 9000)(譯者註:小說及電影《2001:太空漫遊》中的超級電腦)——一台擁有超凡(但有潛在嗜殺傾向)的類人意識並依靠此運行的獨立機器那般——也非讓奇點論者心醉神迷的超級智能。即將到來的人工智慧頗似亞馬遜的網路服務——廉價、可靠、工業級的數字智慧在一切事物的背後運行,偶爾在你的眼前閃爍幾下,其他時候近乎無形。這一通用設施將提供你所需要的人工智慧而不超出你的需要。和所有設施一樣,即使人工智慧改變了互聯網、全球經濟以及文明,它也將變得令人厭倦。正如一個多世紀以前電力所做的那樣,它會讓無生命的物體活躍起來。之前我們電氣化的所有東西,現在我們都將使之認知化。而實用化的新型人工智慧也會增強人類個體(加深我們的記憶、加速我們的認知)以及人類群體的生活。通過加入一些額外的智能因素,我們想不到有什麼東西不能變得新奇、不同且有趣。實際上,我們能輕易地預測到接下來的一萬家創業公司的商業計劃:「做某項事業,並加入人工智慧」。茲事體大,近在眼前。
大約在2002年時,我參加了谷歌的一個小型聚會——彼時谷歌尚未IPO,還在一心一意地做網路搜索。我與谷歌傑出的聯合創始人、2011年成為谷歌CEO的拉里·佩奇(Larry Page)隨意攀談起來。「拉里,我還是搞不懂,現在有這麼多搜索公司,你們為什麼要做免費的網路搜索?你是怎麼想到這個主意的?」我那缺乏想象力的無知著實證明了我們很難去做預測,尤其是對於未來的預測。但我要辯解的是,在谷歌增強其廣告拍賣方案並使之形成實際收益,以及進行對YouTube的併購或其他重要併購之前,預測未來是很難的。我並不是唯一一個一邊狂熱地用著谷歌的搜索引擎一邊認為它撐不了多久的用戶。但佩奇的回答讓我一直難以忘懷:「哦,我們實際上是在做人工智慧。」
過去數年間,關於那次談話我想了很多,谷歌也收購了14家人工智慧以及機器人方面的公司。鑒於搜索業務為谷歌貢獻了80%的收入,因此乍一看去,你可能會覺得谷歌正在擴充其人工智慧方面的投資組合以改善搜索能力。但是我認為正好相反。谷歌正在用搜索技術來改善人工智慧,而非使用人工智慧來改進搜索技術。每當你輸入一個查詢詞,點擊搜索引擎生成的鏈接,或者在網頁上創造一個鏈接,你都是在訓練谷歌的人工智慧技術。當你在圖片搜索欄中輸入「復活節兔子」(Easter Bunny)並點擊看起來最像復活節兔子的那張圖片時,你都是在告訴人工智慧,復活節兔子是長成什麼樣的。谷歌每天擁有12億搜索用戶,產生1210億搜索關鍵詞,每一個關鍵詞都是在一次又一次地輔導人工智慧進行深度學習。如果再對人工智慧的演算法進行為之10年的穩固改進,加之一千倍以上的數據以及一百倍以上的計算資源,谷歌將會開發出一款無與倫比的人工智慧產品。我的預言是:到2024年,谷歌的主營產品將不再是搜索引擎,而是人工智慧產品。
這個觀點自然也會招來懷疑的聲音。近60年來,人工智慧的研究者都預測說人工智慧時代即將到來,但是直到幾年前,人工智慧好像還是遙不可及。人們甚至發明了一個詞來描述這個研究結果匱乏、研究基金更加匱乏的時代:人工智慧之冬。那麼事情真的有變化嗎?
是的。近期的三大突破讓人們期待已久的人工智慧近在眼前:
1. 成本低廉的并行計算
思考是一種人類固有的并行過程,數以億計的神經元同時放電以創造出大腦皮層用於計算的同步腦電波。搭建一個神經網路——即人工智慧軟體的主要結構——也需要許多不同的進程同時運行。神經網路的每一個節點都大致模擬了大腦中的一個神經元——其與相鄰的節點互相作用,以明確所接收的信號。一項程序要理解某個口語單詞,就必須能夠聽清(不同音節)彼此之間的所有音素;要識別出某幅圖片,就需要看到其周圍像素環境內的所有像素——二者都是深層次的并行任務。但直到最近,標準的計算機處理器也僅僅能一次處理一項任務。
事情在十多年前就已經開始發生變化,彼時出現了一種被稱為圖形處理單元(graphics processing unit -GPU)的新型晶元,它能夠滿足可視遊戲中高密度的視覺以及并行需求,在這一過程中,每秒鐘都有上百萬像素被多次重新計算。這一過程需要一種專門的并行計算晶元,該晶元添加至電腦主板上,作為對其的補充。并行圖形晶元作用明顯,遊戲可玩性也大幅上升。到2005年,GPU晶元產量頗高,其價格便降了下來。2009年,吳恩達(Andrew Ng)(譯者註:華裔計算機科學家)以及斯坦福大學的一個研究小組意識到,GPU晶元可以并行運行神經網路。
這一發現開啟了神經網路新的可能性,使得神經網路能容納上億個節點間的連接。傳統的處理器需要數周才能計算出擁有1億節點的神經網的級聯可能性。而吳恩達發現,一個GPU集群在一天內就可完成同一任務。現在,一些應用雲計算的公司通常都會使用GPU來運行神經網路,例如,Facebook會籍此技術來識別用戶照片中的好友,Netfilx也會依其來給5000萬訂閱用戶提供靠譜的推薦內容。
2. 大數據
每一種智能都需要被訓練。哪怕是天生能夠給事物分類的人腦,也仍然需要看過十幾個例子后才能夠區分貓和狗。人工思維則更是如此。即使是(國際象棋)程序編的最好的電腦,也得在至少對弈一千局之後才能有良好表現。人工智慧獲得突破的部分原因在於,我們收集到來自全球的海量數據,以給人工智慧提供了其所需的訓練。巨型資料庫、自動跟蹤(self-tracking)、網頁cookie、線上足跡、兆兆位元組級存儲、數十年的搜索結果、維基百科以及整個數字世界都成了老師,是它們讓人工智慧變得更加聰明。
3. 更優的演算法
20世紀50年代,數字神經網路就被發明了出來,但計算機科學家花費了數十年來研究如何駕馭百萬乃至億級神經元之間那龐大到如天文數字一般的組合關係。這一過程的關鍵是要將神經網路組織成為堆疊層(stacked layer)。一個相對來說比較簡單的任務就是人臉識別。當某神經網路中的一組比特被發現能夠形成某種圖案——例如,一隻眼睛的圖像——這一結果就會被向上轉移至該神經網路的另一層以做進一步分析。接下來的這一層可能會將兩隻眼睛拼在一起,將這一有意義的數據塊傳遞到層級結構的第三層,該層可以將眼睛和鼻子的圖像結合到一起(來進行分析)。識別一張人臉可能需要數百萬個這種節點(每個節點都會生成一個計算結果以供周圍節點使用),並需要堆疊高達15個層級。2006年,當時就職於多倫多大學的傑夫·辛頓(Geoff Hinton)對這一方法進行了一次關鍵改進,並將其稱之為「深度學習」。他能夠從數學層面上優化每一層的結果從而使神經網路在形成堆疊層時加快學習速度。數年後,當深度學習演算法被移植到GPU集群中后,其速度有了顯著提高。僅靠深度學習的代碼並不足以能產生複雜的邏輯思維,但是它是包括IBM的沃森電腦、谷歌搜索引擎以及Facebook演算法在內,當下所有人工智慧產品的主要組成部分。
這一由并行計算、大數據和更深層次演算法組成的完美風暴使得持續耕耘了60年的人工智慧一鳴驚人。而這一聚合也表明,只要這些技術趨勢繼續下去——它們也沒有理由不延續——人工智慧將精益求精。
隨著這一趨勢的持續,這種基於雲技術的人工智慧將愈發成為我們日常生活中不可分割的一部分。但天上沒有掉餡餅的事。雲計算遵循收益遞增(increasing returns)[4]法則,這一法則有時也被稱為網路效應(network effect),即隨著網路發展壯大,網路價值也會以更快的速度增加。網路(規模)越大,對於新用戶的吸引力越強,這又讓網路變得更大,又進一步增強了吸引力,如此往複。為人工智慧服務的雲技術也遵循這一法則。越多人使用人工智慧產品,它就會變得越聰明;它變得越聰明,就有越多人來使用它;然後它變得更聰明,進一步就有更多人使用它。一旦有公司邁進了這個良性循環中,其規模會變大、發展會加快,以至於沒有任何新興對手能望其項背。因此,人工智慧的未來將有兩到三家寡頭公司統治,它們會開發出大規模基於雲技術的多用途商業智能產品。
1997年,沃森電腦的前輩、IBM公司的深藍電腦在一場著名的人機大賽中擊敗了當時的國際象棋大師加里·卡斯帕羅夫(Garry Kasparov)。在電腦又贏了幾場比賽之後,人們基本上失去了對這類比賽的興趣。你可能會認為故事到此就結束了,但卡斯帕羅夫意識到,如果他也能像深藍一樣立即訪問包括以前所有棋局棋路變化在內的巨型資料庫的話,他在對弈中能表現得更好。如果這一資料庫工具對於人工智慧設備來說是公平的話,為什麼人類不能使用它呢?為了探究這一想法,卡斯帕羅夫率先提出了「人加機器」(man-plus-machine)比賽的概念,即用人工智慧增強國際象棋選手水平,而非讓人與機器之間對抗。
這種比賽如今被稱為自由式國際象棋比賽,它有點兒像混合武術對抗賽,選手們可以使用任何他們想要用的作戰技巧。你可以單打獨鬥;也可以接受你那裝有超級聰明的國際象棋軟體的電腦給出的幫助,你要做的僅僅是按照它的建議來移動棋子;或者你可以當一個卡斯帕羅夫所提倡的那種「半人半機」的選手。半人半機選手會聽取人工智慧設備在其耳邊提出的棋路建議,但是也間或不會採用這些建議——頗似我們開車時候用的GPS導航一般。在接受任何模式選手參賽的2014年自由式國際象棋對抗錦標賽上,純人工智慧的國際象棋引擎贏得了42場比賽,而半人半機選手則贏得了53場。當今世上最優秀的國際象棋選手就是半人半機選手Intagrand,它是一個由多人以及數個不同國際象棋程序所組成的小組。
但最令人驚訝的是:人工智慧的出現並未讓純人類的國際象棋棋手的水平下降。恰恰相反,廉價、超級智能的國際象棋軟體吸引了更多人來下國際象棋,比賽比以前增多了,棋手的水平也比以前上升了。現在的國際象棋大師(譯者註:國際象棋界的一種等級)人數是深藍戰勝卡斯帕羅夫那時候的兩倍多。現在的排名第一的人類國際象棋棋手馬格努斯·卡爾森(Magnus Carlsen)就曾接受人工智慧的訓練,他被認為是所有人類國際象棋棋手中最接近電腦的棋手,同時也是有史以來積分最高的人類國際象棋大師。
如果人工智慧能幫助人類成為更優秀的國際象棋棋手,那麼它也能幫助我們成為更為優秀的飛行員、醫生、法官以及教師。大多數由人工智慧完成的商業工作都將是有專門目的的工作,嚴格限制在智能軟體能做到的工作之內,比如,(人工智慧產品)把某種語言翻譯成另一種語言,但卻不能翻譯成第三種語言。再比如,它們可以開車,但卻不能與人交談。或者是能回憶起YouTube上每個視頻的每個像素,卻無法預測你的日常工作。在未來十年,你與之直接或者間接互動的人工智慧產品,有99%都將是高度專一、極為聰明的「專家」。
實際上,這並非真正的智能,至少不是我們細細想來的那種智能。的確,智能可能是一種傾向——尤其是如果我們眼中的智能意味著我們那特有的自我意識、一切我們所有的那種狂亂的自省循環以及凌亂的自我意識流的話。我們希望無人駕駛汽車能一心一意在路上行駛,而不是糾結於之前和車庫的爭吵。醫院中的綜合醫生「沃森」能專心工作,不要去想自己是不是應該專攻英語。隨著人工智慧的發展,我們可能要設計出一些阻止它們擁有意識的方式——我們所宣稱的最優質的人工智慧服務將是無意識服務。
我們想要的不是智能,而是人工智慧。與一般的智能不同,智慧(產品)具有專心、可衡量、種類特定的特點。它也能夠以完全異於人類認知的方式來思考。這兒有一個關於非人類思考的一個很好的例子,今年三月在德克薩斯州奧斯汀舉行的西南偏南音樂節(South by Southwest festival)上,沃森電腦就上演了一幕厲害的絕技:IBM的研究員給沃森添加了由在線菜譜、美國農業部(USDA)出具的營養表以及讓飯菜更美味的味道研究報告組成的資料庫。憑藉這些數據,沃森依靠味道配置資料和現有菜色模型創造出了新式的菜肴。其中一款由沃森創造出的受人追捧的菜肴是美味版本的「炸魚和炸薯條」(fish and chips),它是用酸橘汁腌魚和油炸芭蕉製成。在約克城高地的IBM實驗室里,我享用了這道菜,也吃了另一款由沃森創造出的美味菜肴:瑞士/泰式蘆筍乳蛋餅。味道挺不錯!
非人類的智能不是錯誤,而是一種特徵。人工智慧的主要優點就是它們的「相異智能」(alien intelligence)。一種人工智慧產品在思考食物方面與任何的大廚都不相同,這也能讓我們以不同的方式看待食物,或者是以不同的方式來考慮製造物料、衣服、金融衍生工具或是任意門類的科學和藝術。相較於人工智慧的速度或者力量來說,它的相異性對我們更有價值。
實際上,人工智慧將幫助我們更好地理解我們起初所說的智能的意思。過去,我們可能會說只有那種超級聰明的人工智慧產品才能開車,或是在「危險邊緣」節目以及國際象棋大賽中戰勝人類。而一旦人工智慧做到了那些事情,我們就會覺得這些成就明顯機械又刻板,並不能夠被稱為真正意義上的智能。人工智慧的每次成功,都是在重新定義自己。
但我們不僅僅是在一直重新定義人工智慧的意義——也是在重新定義人類的意義。過去60年間,機械加工複製了我們曾認為是人類所獨有的行為和才能,我們不得不改變關於人機之間區別的觀點。隨著我們發明出越來越多種類的人工智慧產品,我們將不得不放棄更多被視為人類所獨有能力的觀點。在接下來的十年裡——甚至,在接下來的一個世紀里——我們將處於一場曠日持久的身份危機(identity crisis)中,並不斷捫心自問人類的意義。在這之中最為諷刺的是,我們每日接觸的實用性人工智慧產品所帶來的最大益處,不在於提高產能、擴充經濟或是帶來一種新的科研方式——儘管這些都會發生。人工智慧的最大益處在於,它將幫助我們定義人類。我們需要人工智慧來告訴我們,我們究竟是誰。
原文來自 Wired,作者 Kevin Kelly,標題 The Three Breakthroughs That Have Finally Unleashed AI on the World。