最近有關AI繪畫的事情引發了人們的熱烈討論,而伴隨著這一討論,人們不禁再次思考起相關問題,即AI人工智慧在未來是否能夠代替人類的某些工作或工種,AI真的有可能產生自主意識嗎?本篇文章里,作者便發表了他對人工智慧的看法,一起來看一下。
01
最近在網上看到繪畫界對於AI繪畫熱烈的爭論。主要的焦點在於:AI繪畫的興起會給行業帶來什麼樣的衝擊?會否導致大量畫師的失業?
其實,在這幾年AI高速發展的階段里,類似的爭論一直都存在。比如:AlphaGo會不會摧毀圍棋行業?GPT-3會不會摧毀傳媒行業?DeepL會否摧毀翻譯行業?諸如此類。
但這一次,AI在繪畫界引起的反響要更大一些。為什麼?也許一個原因是因為:AI繪畫的興起,的的確確讓人看到了顛覆行業的可能性。
今年6月份,我體驗了一款叫做Disco Diffusion的AI,做出了一些作品。詳見分享一些新知識和生活方式 。當時我的感覺是:非常出色,效果極好,但是對行業尚算不上顛覆。因為出圖速度太慢(一幅圖要渲染10分鐘),並且在構圖、布局上較為欠缺,也無法準確地畫出人物。只能作為輔助工具。
沒想到才過了兩個月,這個觀點就遭到了無情的回擊。
8月份,我嘗試了一款新的AI,叫做Stable Diffusion。它可以說把Disco Diffusion遠遠甩在了後面,不僅出圖速度極快(幾十秒),並且質量極高,在紋理、細節、光影等方面幾乎可以以假亂真,甚至可以忠實地還原出實物的效果。
以下是我從網上找的一些別人用Stable Diffusion做的圖:
可以看到,它出圖的效果,連一般的畫師可能都望塵莫及。
02
那麼,繪畫行業會被AI繪畫顛覆嗎?
實際上,將AI繪畫應用於實踐中已經有了不少案例。一類案例是遊戲工作室。現在已經有不少遊戲工作室,用腳本在後台自動運行AI,在極短的時間內自動生成成千上萬幅頭像、人物和圖標,再精選出能用的進行細化修改和調整,極大地壓縮了成本。
另一類案例是專業畫師。有不少畫師已經開始利用AI繪畫輔助創作。比如,先畫一幅草圖,定好整體布局,然後用AI填充上豐富而飽滿的細節,再在最終的成品上進行微調,節省大量描繪和填充的時間。
可以想見,等AI繪畫更進一步地發展和流行起來之後,大量基礎的執行工作會被替代掉。像「人物頭像」這種創意含量不高、執行步驟較為繁瑣的任務,用AI來操作就可以極大地提升性價比。
進一步,AI也可以成為畫師們的利器。利用AI來輔助構圖、找尋靈感、填充細節……可以極大地解放畫師們的勞動,而把更主要的精力集中在溝通、創意和調整上。就像電腦繪畫替代了大部分手繪一樣,未來無法用AI來輔助創作的畫師,也同樣可能會被同行所替代。
從這個角度來講,不管行業會否被顛覆或摧毀,新的改變已經無可阻擋地、浩浩蕩蕩地到來。
不過,現階段的AI,依然還停留在「工具」的定位。它能發揮出什麼樣的效果,完全取決於使用它的人。畢竟,AI無法取代人去跟客戶溝通,也無法完全理解自然語言,更不具備通常意義上的「自主性」和「創造力」。因此,對於諸多行業而言,它其實更多的是一種機會,而不是威脅。
比如:在AphaGo家族出現的時候,也有許多人驚呼「圍棋是不是要被AI摧毀了」。但其實,圍棋AI給圍棋行業帶來的是什麼呢?是門檻的大幅度降低和普及化。
在過去,你要學圍棋,得去培訓班學習,由專門的老師指導,跟同學對弈、復盤,經歷高強度的訓練。但如今不需要了。現在每個人在家裡,都能非常方便地找到可用的圍棋AI,你可以調整難度跟AI對弈,也可以用AI來幫你復盤。在這種情況下,老師能起到的作用就很小了,只剩下偶爾的點撥和答疑了。
這對於傳統圍棋培訓行業的商業模式當然是一種衝擊,但門檻的降低,也會帶來大量熱愛圍棋的入門者,讓圍棋行業變得更加繁榮。那麼,能否通過轉型適應大環境的改變,就是這個行業需要去做的事情了。
再比如翻譯行業。這幾年,AI翻譯的發展如火如荼。以最新的幾個翻譯引擎來說,翻譯質量已經超越了一般外語水平的使用者,幾乎達到了母語的水準。但AI翻譯能否直接使用、會否替代掉人工翻譯呢?答案也是否定的。
原因很簡單:絕大多數需要翻譯的領域,對翻譯質量都有極高的要求,不僅要求準確,還可能會有專業術語、語境、背景、遣詞用字上的要求,而這是AI難以勝任的。在這種情況下,用AI先粗譯一遍,再進行細緻的潤色,就是更有效的做法。
因此,在這個行業,用AI進行輔助翻譯已經是行業慣例。不使用AI的譯員,可能很難在這個行業立足 —— 因為效率差距實在太大了。從這個角度來講,AI給翻譯行業帶來的,也不是摧毀,而是更高的質量和效率。
這些只是一些消費行業的例子。事實上,近十幾年以來,在全球的各個領域,使用AI作為輔助工具,已經是一種行業發展的必然趨勢,也是一種默認選擇。
比如,在美國,貸款機構已經開始利用AI來決定是否放款。他們會利用一套複雜的演算法,依據客戶的消費、債務和其他數據,最終得出客戶的「信用評分」,並根據信用評分判斷是否批准貸款、批准多少額度的貸款。
在英國,已經有許多地方議會開始利用AI進行社會保障決策。據《衛報》2020年的一項調查,在英國的229家地方議會中,約有100家使用AI來輔助決策,包括決定是否通過福利申請和提供社會保障。
國外的許多公司也開始用AI來進行招聘。從簡歷篩選、職位匹配,到對面試者進行打分和心理評估,節省了大量的人力。
在心理、醫療和健康行業,AI也得到了大量的應用。比如,能夠跟你對話並引導你進行心理干預的AI,能夠結合患者的數據量身制定治療方案的AI,能夠輔助醫生進行診斷和提供治療建議的AI……儘管還未實現大規模普及,但已經有了不少卓有成效的嘗試。
我們都知道能夠偽造視頻和音頻的Deepfake技術,許多人都對其憂心忡忡,但加以規範利用和引導,它也可以發展出正向的應用。比如,目前有一個研究方向,是用AI模擬出逝去的親人,跟我們進行對話。儘管目前只能實現簡單的動態,但假以時日,像《黑鏡》裡面的景象,很可能成為現實。
更有名的可能是GPT-3。GPT是一款非常出色的文本AI引擎,2020年發布的GPT-3,擁有1750億個參數,可以「創作」出足以以假亂真的各種文字,包括小說、新聞、報告、散文……
它的應用空間也極其廣闊。比如:遊戲公司可以用它生成真正隨機的、完全不同的遊戲對白;小說和劇本創作者可以用它來幫助尋找靈感;媒體可以用它來快速生成新聞報道;各類服務提供商可以基於它開發各種各樣的聊天機器人;文學研究者可以用它來進行文本分析……諸如此類。
那麼,它摧毀傳媒行業了嗎?其實也沒有。相反,它的存在,使得傳媒和創意行業的可能性被極大地拓展了,未來的發展空間無比廣闊。許多過去難以實現的效果,都變成了可能。
總而言之,不管各行各業的人怎麼看待AI,AI的到來已經是一種無可爭辯的事實。與其捂上眼睛去詆毀它、漠視它、恐懼它,不如想辦法去迎接它,並利用它去提高自己的效率,實現人力難以企及的突破。這可能是一種更好的心態。
未來並不遙遠,很可能已經在我們身邊。
03
不過,要注意的是,上面所說的AI,都停留在工具的層面,也就是「弱人工智慧」。本質上來說,它們只是一段對信息進行加工處理的程序。我們餵給它們一堆數據,它們再根據規則吐出我們想要的結果,僅此而已。跟我們所理解的「人工智慧」有著天壤之別。
如果我們把科幻片里的人工智慧 —— 那種有意識、有人格、有自己的「思想」,能夠「理解」自己在做什麼的強人工智慧,看作100%的形態的話,那麼目前的AI,可能只是不到1%。
換句話說,如果強人工智慧可以看作生命的話,那麼目前我們實現的弱人工智慧,最多可能只是一個氨基酸。
這也說明,目前的AI只是一個極其初級的形態,它的成長空間幾乎是無限的。實際上,現階段的AI翻譯引擎,比起幾年前的版本,質量好了不止一個檔次;同樣是擴散模型,Stable Diffusion比起年初的Disco Diffusion,也好了不止一個檔次。
那麼,弱人工智慧跟強人工智慧的分野究竟在哪裡呢?我們有沒有可能對AI進行不斷的優化和提升,使之最終能夠達到強人工智慧的程度?如果能夠實現的話,到時的世界會變成什麼樣子?
以下是我的理解和思考,不一定對,僅供參考。
我們知道:目前所有的AI,不管是什麼領域、採用什麼模型,它們的本質都可以大致歸納為三步:訓練,預測,反饋。
首先,我們需要餵給AI大量的數據,告訴它「我們希望它學到什麼」,讓它從這些數據裡面提煉出特定的模式。這就叫做訓練,這些數據就叫做訓練集。
從訓練集中提取出模式和特徵之後,AI就可以根據這些模式,基於不同的場景,去「預測」在這個場景下會出現什麼、應該如何應對。這就是AI能夠產生的結果。
最後,就是對AI所產生的結果提供反饋,告訴AI它做得好不好、對不對,從而讓它不斷進行自我修正、自我提升,最終能夠產出更好的成果。
一個常見的例子就是生成對抗網路(GAN)。它包含一個生成網路和一個對抗網路。用繪畫來打比方:生成網路的任務,就是我們給它一堆訓練集,比如說某個畫家的許多幅畫作,讓它努力地學習畫家的風格,然後想辦法創作出一幅以假亂真的畫。
而對抗網路的任務,就是努力去挑生成網路的刺,把它創作的畫從真畫中區分出來。通過這樣的「左右互搏」,AI就能夠不斷自我提升,最終達到真正以假亂真的效果。
但是,目前所有的AI都存在一個問題:它們所有的訓練集來源,都來源於數碼信息。換句話說,它們相當於「活」在數碼空間裡面,跟我們所處的現實物理空間是沒有任何交集的。因此,它們永遠沒有辦法真正「理解」所得到的數據,而只能按照自己從數碼空間得到的規律去生硬地「套用」在信息上面,完成我們要求的任務。
一個經典的例子是「莫拉維克悖論」:儘管AI可以做到許多人腦無法實現的事情,比如在一秒內完成上千萬次運算、處理上百萬條數據、做出極其複雜的決策,但是一些對人類來講極其簡單的任務,比如用眼睛區分兩個杯子,在一個房間里自由行走,或者理解一段對話的上下文,對它們來說卻難如登天。
為什麼會這樣呢?因為,數碼世界是沒有辦法自發地產生數據,構建出一個完整的、自洽的世界的,它的一切數據,都來源於現實世界的「投射」。也就是說,它只是現實世界的一個「降維」的投影而已。因此,「活」在低維度世界的AI,只能理解我們輸入給它、為它制定的規則,是不可能真正理解高維度的世界的。
打個比方:就像一部小說里的角色,哪怕寫得再生動、再鮮明,他也不可能真正活過來,理解小說之外的現實世界。同樣,目前的AI,只能是一種工具,它不可能具備真正意義上的意識、人格和「生命」。
04
人工智慧哲學界有一個經典的問題,叫做「框架問題」。丹尼爾·丹尼特是這樣表述它的:
假設現在有一個洞穴,洞穴里有一塊電池,洞穴外有一個機器人,快沒電了,機器人必須拿到這塊電池。但與此同時,電池綁著一顆炸彈,觸動電池就會引發炸彈。
機器人1號:被下達指令「拿出電池」。但拿出電池的同時,它也被炸毀了。因為它不知道觸動電池同時會引發炸彈。
機器人2號:下達指令「做一件事時,必須考慮它是否會導致其他事件的發生」。於是,機器人2號一直在思考:當我拿動電池時,牆壁會變色嗎?天花板會塌下來嗎?等等。最終沒電了。
機器人3號:下達指令「只考慮跟任務相關的事,不考慮不相關的事」。於是,機器人3號一直在思考:哪些是跟任務相關的,哪些是不相關的?牆壁相關嗎?天花板相關嗎?於是也沒電了。
簡而言之:對於AI來說,讓它知道「應該在一個什麼樣的框架內去考慮問題」是非常困難的 —— 儘管這對人類來說毫無難度。
那麼,為什麼AI存在框架問題,而人類就沒有這個問題呢?
我們不妨想一想:我們是如何知道「當我拿動電池時,天花板不會塌下來」的?是因為我們看到了這條規則嗎?不是的。是因為我們知道:天花板是一個穩定的結構。一般來說,如果沒有外力對它進行作用,它是不會變化的。
那麼,我們又是如何知道「天花板是一個穩定的結構」的?是有人教給我們這條規則嗎?也不是。是因為我們在成長的過程中,我們看到過非常多次的天花板,我們從生活經驗中學習到天花板的特性,知道它不會輕易地塌下來,於是我們的大腦自發地從這些經驗中提煉出了這條規則。
許許多多這樣的規則組合起來,就形成了我們對這個世界的認知,也形成了我們思考問題、考慮問題的「框架」。
但AI是沒有這些「生活經驗」的。它們的所有信息來源,只有現實世界投射到數碼世界的信息。因此,對它們來說,所有的信息本質上都是一堆數字,它們無法把這對數字還原成規則和框架。
我們在生活中看見過無數次的人臉,那麼不需要別人教我們,我們也會知道人的臉有五官、大致的比例是什麼。但AI沒有這些經驗。對它來說,「人臉」也只是一堆數字而已,只不過這些數字經常一起出現,似乎存在某種特定的規律 —— 這就是AI眼中的世界。
再比如,看到「落霞與孤鶩齊飛,秋水共長天一色」,會讓我們產生各種各樣的想象,體驗到審美的愉悅感;但在AI眼中,這14個字只是一堆數據,無法產生任何聯想,因此並不存在任何「意義」和「美感」。
所以,要想讓AI能夠真正理解現實世界,也許只有兩種方式。要麼,是找到一種方法,可以更加有效地傳達給它關於現實世界的種種規則和「隱性知識」,讓AI具備跟人類相似的思維基礎;要麼,是讓AI模仿人類的成長過程,直接從現實世界中學習規則,構造關於現實世界的各種表徵。
後者現在也開始有研究人員在探索了。今年發表在《Nature》上的一篇研究講到:他們基於發展心理學設計出了一款機器人,可以像人類嬰兒一樣學習簡單的物理規律。這個機器人在學習后,當看到不符合物理規律的畫面時,會呈現出「驚訝」的反應 —— 這或許是一條可行的道路。
那麼,AI有沒有可能發展出真正的強人工智慧?如果到了那一天,這個世界會變成什麼樣子?
說實話,我也不知道。如果AI真的能夠彌補這一空缺,真正像人類一樣思考和學習(或者起碼「看起來」像),那麼,理論上來說,似乎沒有什麼是無法實現的。到時的世界,也許會變得完全不一樣。
儘管從目前看,這一天似乎還要很久。
05
最後,聊一個有趣的問題:AI會有意識嗎?如果我們真的面對著一台宣稱它具備了意識的AI,我們如何判斷它是否具備意識呢?
圖靈測試嗎?顯然不行。圖靈測試測的是智能,而非意識。
意識是什麼?是能夠體驗和感知到自身存在的一種狀態。一個有意識的個體,它能夠體驗到自身的存在,能夠有主觀的感受(我們稱之為感質,qualia),而不是只是對輸入信息做出固定的、程式化的響應。
哲學家 Susan Schneider 提出過一個很有意思的「人工智慧意識測試」。她認為:如果一台機器具備意識,能夠體驗到自我的存在,那麼它一定也能產生跟意識相關的其他想法和感受,比如:靈魂,輪迴,自我,等等。
一個簡單的類推:我們每個人一定都曾經有過類似的想法:我是誰?為什麼我會是「我」,而不是其他任何人?藏在「我」身體里,構成我的種種想法、念頭和主觀感受的那個東西是什麼,在哪裡?諸如此類。
Susan Schneider 認為,這是有意識的生物所必然會經歷的困惑和思考。一個對象有了意識,意識到自己的存在,必然會對這種存在感到好奇,進而去探尋和思考這種存在的本質。
因此,「人工智慧意識測試」的步驟如下:
- 阻止人工智慧去學習關於意識、心靈、存在等相關的哲學和科學知識。
- 跟它正常交流,聊聊意識、心靈、存在……看它能不能流暢地、自然地進行回答。
如果能,那可能意味著人工智慧自發地產生了對這些話題的理解和體驗。這種體驗來自哪裡呢?既然沒有外在信息的輸入,那隻能是來自於它自身所產生的意識體驗了。
當然,讓AI產生意識的難度,可能比產生強人工智慧的難度還高。
我無比期待這一天的到來,又無比擔憂這一天的到來。
作者:李睿秋Lachel;公眾號:L先生說(ID:lxianshengmiao)
原文鏈接:https://mp.weixin.qq.com/s/wc7x8UpPwb1nQZpkEiSruQ