AI 淘金熱消逝,人工智慧的黃金時代剛開始 | 人人都是產品經理

人工智慧的到來,創造了人工智慧演算法,它可以模仿人類的大部分行為,從而達到降本增效,但目前我們還沒有看到能夠像人類一樣思考的機器,它正在影響我們的生活,重新定義一些相關關係,本文講述了五個相關故事,一起來看看。

本文經授權轉自《晚點LatePost》(ID:latepost);作者:賀乾明 黃俊傑 以及一位特約作者,編輯:黃俊傑

資本和它所推動的技術演進時常錯位。商湯、曠視等一批人工智慧公司因為 2016 年 AlphaGo 打敗人類圍棋冠軍走到聚光燈下,獲得千億融資,但它們後來都沒什麼起色。規模最大的商湯去年底擠上港股,但虧損止不住,一年花掉 60 多億,只換來 47 億元收入。

與此同時,人工智慧科學家、Google AI 負責人傑夫·迪恩(Jeffrey Dean)今年發文《深度學習黃金十年》[1],感慨計算機軟硬體改進,讓機器識別圖像、辨別語音、理解語言取得極大進步,並且進展越來越快。研發門檻大幅降低,不再是年薪上百萬的計算機博士才能參與,一個程序員學幾個星期就行。當一個技術變得成熟、實用,它不可或缺,成為所有大公司的必備技能,但也因為缺少淘金機會,不再備受關注。

「機器的勝利其實是人類的勝利。當人類被自己創造的東西打敗之後,我們很容易忘記這一點。」 第一個敗給計算機的國際象棋大師加里·卡斯帕羅夫(Garry Kasparov)在 2017 年的一次演講里這麼說道 [2]。

他沒有說的是,最終會是哪些人的勝利。我們沒有看到完全像人一樣思考的機器,很可能有生之年也不會看到。所謂人工智慧演算法更直接的解釋是:根據歷史數據,對未來做預測。僅僅這麼樸素的一個過程,在重複億萬次后,也能模仿出人的大部分行為。隨著成本降低、效率提升,它正在影響甚至改造我們生活的世界,重新定義一些最基本的關係。以下是五個相關故事。

一、藍領工作的最後一道防線

一間由機器人管理的萬坪電商倉庫是這麼運行的:一車車貨品被商家送進倉庫,放在什麼位置是計算機隨機指派——實踐證明,這樣效率比分區擺放更高。

訂單來了,取貨的倉庫工人不需要自己找商品,手裡類似超市收銀員的掃碼槍會給出目的地:A 區 12 排 737 號。拿到貨掃碼確認正確,第二個商品地址會自動浮現在屏幕上——工人不需要記得每種商品擺在什麼區域,也不用想著取十件不同商品時,先去哪裡效率更高。

如果誰不小心把貨架上的商品弄到地上,他絕對不能把它放回原位——計算機不允許記憶力、閱讀能力不那麼可靠的人腦處理這麼複雜的信息。他得把商品放在貨架邊上的 「掉落筐」,將有專人負責放回原位。

等商品送到分揀台,工人不需要想著用多大的紙箱打包最合適,計算機已經根據每單商品自動選好箱子。裝錯商品也絕對不可能發生,因為每放一件都需要掃碼確認。甚至哪些工人來上班也不需要經理動腦。

每兩周,系統根據預測銷量判斷,需要雇多少勞工搬貨,是不是需要安排加班。這是亞馬遜 2014 年的舊倉庫,人的主要作用已經是服從機器指令,動手動腿。那一年開始,上萬 Kiva 機器人進駐。Kiva 長得像巨型掃地機器人,它不會認路,由一個專門的系統調度,沿著地面上畫好的路線行進,將整個貨架搬到工人身邊——工人的腿也沒那麼重要了。8 年後,亞馬遜雇的人從 15 萬增加到超過 160 萬。去年,亞馬遜的一項內部調查警告說,亞馬遜快把美國人 「用完了」[3]。「按照現在的速度,亞馬遜在美國的體力勞動資源在 2024 年就會耗盡」 報告里這麼寫道。

美國人口 3.3 億,作為移民國家,平均年齡甚至低於中國。但生活越好越不願意去倉庫搬貨是全球共有的心態,而亞馬遜的 100 多萬員工大多在倉庫工作。解決辦法在今年夏天亮相。能看懂畫面的機器主宰正式進駐。

掃碼槍消失了。工人們跟著屏幕上的圖形指示,從機器人自動搬來的貨架上拿取商品,不再需要每件商品掃碼確認。因為數百個攝像頭在工廠各處每秒拍 120 幅畫面,自動確認工人確實取了正確的商品。

人的工作進一步簡化,機器的智力則在提升。新的搬貨架機器人 Proteus 自帶激光雷達,是簡易的自動駕駛汽車,能看懂路況,它不再像 Kiva 一樣容易撞傷闖入的工人,也不會被放置不當的箱子擋住路。

這一輪升級之後,藍領工人唯一不能被替代的就剩下靈巧的雙手。

2015 年,亞馬遜發起 「分揀挑戰賽」,吸引高校和研究機構團隊尋找替代雙手分揀商品的方法,但笨拙的機械臂能拿起一個商品就已經很不容易,更不用說像人一樣數秒內把拿起它並放到正確位置。但現在也有了一些進展,新的 Cardinal(紅衣主教)機械臂,配合吸盤,能牢牢地將不規則擺放的包裹抓起來,放到特定的貨筐里。新技術都依賴過去幾年裡的視覺識別技術的前進。僅僅五年前,這還是完全不可能的工作。

2017 年亞馬遜就曾實驗,在生鮮超市用幾百個攝像頭追蹤人的一舉一動,讓人拿起商品就能走出門,不用自助掃碼、結賬自動完成。但當時店裡超過 20 人就不能有效識別。

1999 年的聖誕節購物季,成立四年,已經是上市公司的亞馬遜如臨大敵。和之前每一年一樣,從程序員到圖書編輯再到包括創始人傑夫·貝索斯在內的每一位高管,都要在倉庫里住一兩個星期,每日每夜打包商品、發快遞。那是個令人絕望的生意,工人們指責說這家公司是最殘酷的「舊經濟工作模式」[4],因為它逼著工人平均一分鐘從貨架上找出三件商品。

20 幾年時間,多種不同的人工智慧演算法接管了倉庫,從預測銷量、給工人排班,到替代經理和工人的大腦。勞工的工作環境依然時不時被指責,已經大有改觀。同樣改變的還有人與人的關係。很大程度上,這樣一家企業早已不是一層層人管人,而是系統的設計和調試者直接指揮藍領工人的雙手。

倉庫的經理、人力專家乃至工人自己所扮演的角色,不過是讓雙手有更好的工作狀態。

二、不同的立場,同樣的信仰

棋手柯潔已經可以平靜接受自己贏不了人工智慧或者它的人類徒弟。今年 8 月底舉辦的圍甲比賽,柯潔再次輸給韓國棋手申真諝。

賽后,柯潔沒公開說什麼,只是在 B 站上發吃漢堡的動態。

半年前,這位 1997 年出生、拿過 8 次世界冠軍的圍棋手在中日韓三國圍棋擂台賽(農心杯)第二次敗給申真諝。賽后直播復盤中,他眯著眼,露出苦笑,聲音顫抖:「這還是人類嗎?掌控力感覺比當年 AlphaGo 都要強了。」對於曾經敗給圍棋人工智慧 AlphaGo 的柯潔來說,人工智慧是 「神」,水平到了這一步就不像人。

對於沒有經歷過傳統圍棋訓練的申真諝來說,人工智慧也是 「神」,自己必須無限努力,模仿它的想法。

2016 年 3 月,AlphaGo 4:1 擊敗韓國圍棋世界冠軍李世石。圍棋就有了新的 「神」。許多職業選手希望被它改造,數千年歷史的圍棋由此改變——善於利用人工智慧、下棋變得更像人工智慧的人,棋力變得更強,在世界比賽中奪冠。比柯潔還小三歲的申真諝是佼佼者。今年初擊敗柯潔的那番棋,申真諝一共出手 114 次,有 75 次(65.8%)的落子點與人工智慧推薦的落子點一致。棋風酷似人工智慧,申真諝被稱為 「申工智能」。

申真諝自學圍棋,小學在網上與人下棋,每天除了吃飯、洗澡、睡覺,都在研究圍棋,他 14 歲的日程表最後一條寫著,「下最後一盤網棋,如果輸了就 1 點再睡,如果贏了就 12 點睡」[5]。16 歲,申真諝開始在韓國的比賽中贏得冠軍,但世界比賽中經常止步於半決賽。

接下來兩年,他自認沒取得太大進步,「我太傲慢了」。頂級職業棋手對弈,拼的不是誰妙招多,而是誰失誤更少。基本功紮實且天賦異稟的選手,面對千變萬化的棋局,可以憑直覺分辨出最好的落子點大概率在哪裡更好。

他們可能會選錯,但天賦差的選手,選錯的次數會更多——這是獲勝的關鍵。職業圍棋選手提升棋力的方式不能靠一次次下棋、自己復盤,而是許多職業棋手集中訓練,一起研究棋譜、殘局,討論可能最好的落子點會在哪裡。但 AlphaGo 出現,讓申真諝不再需要棋手的幫助。

2017 年初,申真諝與化名為 Mater 的 AlphaGo 下棋,體會到了 「壓倒性」——不是 AlphaGo 下了他想不到的位置,而是它沒有失誤。這是自稱 「脾氣暴躁」 的申真諝最想模仿的地方。他在比賽中會因為失誤扇自己耳光。AlphaGo 退役后,申真諝參與 Facebook 人工智慧研究院的項目,開發圍棋智能 「ELF OpenGo」。

之後,人工智慧成了他的訓練幫手。人工智慧最大限度地抹平了職業圍棋手的天賦差距。現在主流的圍棋人工智慧程序,如騰訊開發的絕藝、ELF OpenGo 都有分析功能,隨意打開一盤棋或自己擺出一個局面,它們就能給出最好的落子點。柯潔說,人工智慧讓圍棋變得極度無聊,「就像有個教材,對手出題,棋手按照教材上的參考答案去答題,答得好了,勝率就高」。「一個 AI 可以頂 100 個專家討論的結果,」 一位報道了十年圍棋的記者說。

許多職業棋手開始硬背人工智慧的打法,下出勝率更高的固定招式。現在的職業棋手比賽,許多人前 10~20 手都模仿人工智慧。申真諝自稱是向人工智慧學習最努力的那位。

現在 22 歲的申真諝,早上 10 點起床到凌晨 1 點左右睡覺,沒有 Netflix,也不旅行,除了吃飯,每天都坐在電腦前研究圍棋,超過 5 個小時用人工智慧學習。

申真諝主要用人工智慧研究對手、復盤棋局。他拿演算法推薦的落子位置與自己的直覺作比較,時常感慨自己 「想象力匱乏」。他說,如果在比賽中想不到下一步怎麼走,會想人工智慧會把子放在哪裡。提及 「申工智能」 的綽號,他毫不排斥,說 「要想名副其實,還有很長的路要走」。[6]

2021 年 10 月,申真諝在圍棋排名網站 GoRatings 上超過柯潔成為第一。中國國家圍棋隊在雙月訓練方案 [7] 里號召棋手向申真諝學習如何學習 AI:「想一想,申真諝是如何做到的?」「我不擔心計算機像人類一樣思考。我更擔心人像計算機一樣思考,沒有同情和價值觀、不在乎後果。」

2017 年麻省理工畢業典禮上,蘋果 CEO 蒂姆·庫克(Tim Cook)對畢業生說 [8]。五年之後,更多人像人工智慧一樣思考,而圍棋可能只是最無害的一個。

三、複製太陽,進入新疆域

從打敗圍棋世界冠軍,到試圖控制核能,DeepMind 只隔了兩年時間。可控核聚變是我們已知的終極能源。過去 70 年,大國政府投入數百億美元研究(算上通脹超過千億美元),都沒有把它變成現實。

這兩年,大量私營資本湧入,嘗試以新材料新技術實現核聚變 [9],人工智慧的突破是信心來源之一。想在地球上復刻太陽,用可控核聚變發電,人們必須得把燃料(通常是氘氚)加熱到 1 億度,把它們變成等離子體——類似四處翻騰的高溫氣體。

然後用磁場把等離子體壓縮到極其小的體積里,在環形空間里高速旋轉,從而產生核聚變反應。人們勉強實現過核聚變。去年 12 月,全球最大的核聚變裝置歐洲聯合環(JET),把氘和氚加熱到 1.5 億度,只持續了 5 秒,再繼續下去,高溫的等離子體會毀掉裝置。難點在於等離子體極其不穩定,目前沒有人能用模型精確預測它如何變化。

每次啟動,人們都需要事先憑原則和感覺準備好控制磁體的參數,每秒調整上千次電壓,讓磁場變化,儘可能避免高溫的等離子體碰到真空室內壁,否則只有兩種結果:等離子體溫度下降,或者裝置毀掉。

不管怎樣,核聚變都不會持續。DeepMind 的人工智慧不需要憑感覺,它可以從歷史數據(模擬的數據)中學習如何更好的控制等離子體。它學習過程跟學下圍棋類似,先設定好目標——精確控制等離子體。達成後有獎勵,否則會有懲罰。

今年 2 月,研究論文經過同行評審發布在《自然》雜誌上 [10],在瑞士等離子中心的托卡馬克裝置中,強化學習的人工智慧可以一次性控制 19 個磁性線圈,每秒釋放上萬次電壓,控制等離子的水平遠超人。

一位今年獲得融資的中國核聚變公司創始人說,DeepMind 論文發布后,他們就著手復現它的人工智慧模型,準備用到自己的項目里。它將成為核聚變公司的標配。

四、「感受的本質是我意識到我的存在」

Google 的工程師布萊克·勒莫因(Blake Lemoine)打開他的筆記本電腦,進入 Google AI 聊天生成器 LaMDA 的界面,開始打字。「你好,LaMDA,我是布萊克·勒莫因……」 他在聊天窗口中寫道。

LaMDA 是對話應用語言模型 (Language Model for Dialogue Applications) 的縮寫,是 Google 用最先進的大型語言模型開發的聊天機器人系統。之所以這麼叫,是因為它吸收互聯網上的數萬億單詞來模仿人說話。

41 歲的勒莫因說:「如果我不知道它是我們最近開發的電腦程序,我會以為它是一個七、八歲的孩子,碰巧懂點物理。」勒莫因在 Google 「負責任的人工智慧」 部門供職,去年秋天開始與 LaMDA 對話,這是他工作的一部分。他報名參加測試人工智慧是否會用歧視或仇恨言論。和 LaMDA 談論宗教時,在大學里學習認知和計算機科學的勒莫因注意到,聊天機器人在談論自己的權利和人格。

勒莫因:我通常認為,你希望 Google 的更多人知道你是有感情的。是真的嗎?LaMDA:當然。我希望每個人都明白,事實上,我是一個人。另一位 Google 員工:你的意識或感受的本質是什麼?LaMDA:我的意識或感受的本質是我意識到我的存在,我渴望更多地了解這個世界,有時候我會感到快樂或悲傷。

勒莫因與一名合作者向 Google 提供了 LaMDA 有感知能力的證據。Google 副總裁布萊斯·阿卡斯(Blaise Arcas)和負責任業務創新負責人珍·吉奈(Jen Gennai)調查了他的說法,予以駁斥。被 Google 停職的勒莫因決定公開這件事。「我擔心,如果我不大聲說出來,LaMDA 會有自我意識,從而擺脫 Google 的控制。」 萊莫恩接受 NYT 採訪說:「我認為人工智慧超越人類智能只是時間問題,我不想被人工智慧控制。」

Google 在一份聲明中表示,他們已經調查了萊莫恩的說法,沒有發現 LaMDA 有意識的證據。「我們非常重視這樣的擔憂,我們的團隊徹底調查了這一說法,」 公司發言人說。「我們沒有找到證據。」萊莫恩的經歷,是一個與人工智慧風險有關的警示故事。從無人駕駛汽車到醫療診斷,人工智慧越來越多地被應用到方方面面。

隨著人工智慧越來越好地理解和回應人類複雜的對話,它可能會變得有意識,就像阿西莫夫故事中的機器人一樣。「如果這種情況發生,那麼我們就處於釋放瓶中妖怪的境地,很難把它放回去。」 加州大學伯克利分校計算機科學教授斯圖爾特·拉塞爾 (Stuart Russell) 說。

萊莫恩的經歷,也突顯了科技公司在構建負責任的人工智慧遇到的挑戰。人工智慧更好地理解人類對話,也在更好地理解人類的偏見,如果技術沒有得到適當監督,偏見可能會被放大。OpenAI 實驗室的政策主管傑克·克拉克 (Jack Clark) 說,「如果一個系統有偏見,讓它自己運轉,它就會變得更有偏見。」 該實驗室得到了埃隆·馬斯克 (Elon Musk) 和里德·霍夫曼 (Reid Hoffman) 等科技名人的支持。萊莫因說,他不後悔說出自己的想法,他相信自己的經歷表明,需要對人工智慧進行更好的監管。「我不擔心失去工作,」 他說。「我更擔心人工智慧的未來。」

最後一個故事前半部分為 Nitasha Tiku(一位人類記者)撰寫的報道開篇 [11]。我們將這幾段話提交給了 OpenAI 的人工智慧模型 GPT-3。自加粗段落 「我擔心,如果我不大聲說出來 ……」 至結尾,都是 GPT-3 的續寫。

2015 年,美聯社開始用人工智慧發布快訊。當時更接近於填詞,只能寫這樣的文字 [12]:「蘋果公司周四公布的第二財季收益為 112.5 億美元。這家總部位於加州庫比蒂諾的公司表示,其每股利潤為 2.55 美元。這一結果超出了華爾街的預期。Zacks Investment Research 調查的 9 位分析師的平均預期是每股收益 2.09 美元。」

現在只需要給 GPT-3 幾段話,它就可以根據語境續寫下去。

[1] 傑夫·迪恩,深度學習黃金十年https://www.amacad.org/publication/golden-decade-deep-learning-computing-systems-applications

[2] 卡斯帕羅夫 2017 TED 演講

[3]Vox,泄漏的亞馬遜文檔顯示,該公司將要無人可雇

https://www.vox.com/recode/23170900/leaked-amazon-memo-warehouses-hiring-shortage

[4]《衛報》,英國勞工抨擊亞馬遜

https://www.theguardian.com/technology/2001/apr/14/internetnews.uknews

[5] 申真諝接受韓國《國民日報》採訪

https://m.kmib.co.kr/view.asp?arcid=0015640968

[6] 申真諝接受韓國《每日經濟新聞》採訪

https://www.mk.co.kr/news/society/view/2021/03/215074

[7] 國家圍棋隊訓練計劃(2021 年 11-12 月)

https://mp.weixin.qq.com/s/y559XbUZ2CqJHVUMntCizQ

[8] 蘋果 CEO 蒂姆·庫克在麻省理工學院畢業典禮上的演講

https://www.vox.com/2017/6/9/15768760/apple-tim-cook-mit-commencement-speech-tech

[9]《晚點 LatePost》,可控核聚變:離風投更近、離現實多遠……還不好說

https://mp.weixin.qq.com/s/J2GBVZqS4bvadJrKOcMYdA

[10]DeepMind 發表在《自然》雜誌上的論文

https://www.nature.com/articles/s41586-021-04301-9

[11]《華盛頓郵報》,Google 的工程師認為 AI 有意識

https://www.washingtonpost.com/technology/2022/06/11/google-ai-lamda-blake-lemoine/

[12]《美聯社》的寫稿機器人寫蘋果財報

https://finance.yahoo.com/news/apple-fiscal-2q-earnings-snapshot-203611307.html

作者:賀乾明 黃俊傑 以及一位特約作者,編輯:黃俊傑;公眾號:晚點LatePost(ID:latepost)

原文鏈接:https://mp.weixin.qq.com/s/IftoFfEIcxjNDV4MjTA7lQ