#本文為人人都是產品經理《原創激勵計劃》出品。
前不久,一幅由AI軟體創造出來的畫作《空間歌劇院》在網路上引起爭議。網路上有兩派聲音,一派認為這畫是AI創作的,沒有靈魂,不能和人創作的畫作一起評比;另一派認為,這是AI已經能創作出符合人類審美的創意作品了,是技術的一大進步。本文作者對此進行了分析,與你分享。
一、AI畫畫做得有多好了?
最近一個新聞非常出圈,並且成功登上微博熱搜,一個來自美國的39歲的遊戲設計師用AI畫畫工具-midjourney創作的一張作品,獲得了科羅拉多州博覽會的藝術比賽第一名。
作品名稱叫做《空間歌劇院》,作品本身非常漂亮,作為一個藝術圈外行的我,都覺得這張畫作拋開本身創作來源不講,都是一個配得上大獎的作品。AI至少比我畫的好多了,甚至贏了很多其他參賽的人類藝術家。
事情一出,評論呈兩極化分佈,對於「老藝術家」派們當然對於這件事情十分抵制,認為這畫是AI創作的,完全沒有意義,沒有靈魂,作者根本就是褻瀆藝術,他不配做一個畫家。
而另外一派,當然是像我一樣的AI從業者或者是技術擁躉,我們看到這樣的作品是非常激動的,AI創作得也太美了,驚為天人,前途無量,於是第一時間上網把所有的熱門AI畫畫軟體都試了一遍。
作為吃瓜群眾的你們,怎麼看待這張AI創作獲得大獎的事情呢?
無獨有偶,另一個主打「免費開源」AI畫畫的公司stablediffusion,目前已經估值超過10億美金,這離他們發布才過去了1個月,與上文提到的獲獎的midjourney(新註冊免費送25次)和Dall.E不同的是,這個工具完全免費,不限次數、任何人都可以使用。
而且親測,stablediffusion是幾個AI畫畫工具中交互最為簡單的。比起Google的另一款競品discodiffusion,需要註冊谷歌機器學習平台,甚至要手動調整一些參數,對於一些非技術從業者要友好多了,基本上就是有手聯網就可以用。
谷歌的discodiffusion
stability.ai的stablediffusion
除了交互更加友好外,stablediffusion的創作風格更加寫實(更加符合主流大眾審美),比如我在midjourney上創作的作品有點後現代抽象畫的感覺。
文字prompt:一隻綠色海豚在紫色海上飛躍遠方有一艘巨輪(版權歸大仙河所有)
而OpenAI的DallEmini是「梗圖風」,百度的「文心.一格」風格偏向於二次元/國畫風,位元組的tiktokAI偏向油畫風。
除了繪畫風格外,商業模式或者是版權也是stablediffusion為什麼僅僅上線一個月就亂拳打死老師傅的另一個原因。
因為版權或者是所有權是決定一個內容創作產品的商業模式的主要因素,比如百度一格的作品所有權就歸百度所有,你就不太可能拿這個AI平台創作的作品去進行銷售,或者是放在各種商業宣傳的文案里作為插圖(參考視覺中國的故事)。百度的商業模式就是賣版權。
另外的玩法,比如midjourney,類似軟體使用付費,除了剛開始的一些免費試用,後面創作都是要付費的。當然這產生的作品版權就是歸用戶所有了。
Stablediffusion很顛覆的地方就在於,版權歸用戶外,平台還免費不限次數使用,交互方式還比其他競品更好用,是不是有點像互聯網剛開始沖入傳統行業的打法?此外其還在官網上寫著「bythepeople,forthepeople」,意思是民治和民享,是不是有點天下為公的意味。
所以stablediffusion做到了真正的出圈,很多其他行業的從業者,比如我們產品經理經常用來畫原型交互的figma,就準備引入stablediffusion的創作能力,一句話生成用戶界面元素。
看到這裡,我突然明白了為什麼看到了ai60「一句話」畫畫的「超能力」后,很多插畫師陷入了深深的焦慮,說實話,作為產品經理的我也很焦慮。
二、AI畫畫是如何做到符合人類的創意和審美的?
焦慮歸焦慮,我們即使要被取代,最好也要明白自己是如何被AI一步步取代的。
網上寫diffusion的文章很多,但是大部分都是講如何使用,或者評論diffusion的作品如何驚為天人。要麼就是特別專業的角度,給大家拆解模型。
作為一個AI產品經理,我嘗試用大眾能聽懂的話為大家解釋下AI是如何創作出來如此及美輪美奐的作品的。
首先,大家需要知道一個關於自然語言大模型的背景知識,如果不知道的可以複習我的上一篇文章「我和AI聊了一下午,被氣哭了」,沒看過或者看過忘了的都可以去與預習或者複習下,加深記憶。
「AI畫畫」原理網路架構(能力強的讀者嘗試理解,主要看文字描述)
我們提到了AI想要理解人,或者能和人們對話,需要上億的參數、超大模型再加上海量的數據,才能回答一些人們常規的問題或者理解人們某些話背後的含義。
自然語言大模型是第一步,相當於把人們說的話(文字)轉換為機器能理解的語言或者是參數(或者是一個公式)。但是這個表示對於人類是完全看不懂的,對於機器卻包含了非常豐富的信息。
機器拿著這個表達+一個混合著隨機添加的高斯雜訊的圖片(大家理解成電視機的馬賽克圖片,混沌狀態),一起送到一個網路中訓練,這個訓練的目標就是得到一個交叉熵最小值,相當於就是解一個非常複雜的很多元的函數(這個過程需要計算機不斷地計算,不斷的迭代)。
求解完函數后,機器再把這個函數的未知數求得的值送到一個編解碼器中,類似電視台發射電視節目信號進行編碼,最終家裡電視再接收解碼輸出畫面。你家裡就不再是雜訊的雪花點了,逐漸出現了電視節目的畫面。
AI畫畫(diffusion擴散模型原理)大仙河版解釋
最後就能把這個圖像生成出來了,這個圖就是計算機/AI理解的人類描述語言的畫面。以上就是白話版AI畫畫的原理(專指diffusion擴散方法,包括上文提及的各種競品)。
看完了上述原理,你還覺得自然語言大模型是無用的嗎?你還覺得人工智慧是人工智障嗎?正是因為有了各種自然語言大模型(無論是英文的、中文的),才能讓「AI畫畫」成為可能。
如果說大家覺得各種AI虛擬聊天助手智商堪憂的話,可以嘗試AI畫畫,真正可以感受到科技的力量,因為畢竟「一圖勝千言」。
至少對於我來講,一個AI行業的非技術從業者,也在體驗了「AI畫畫」之後,覺得「大模型」真香。
今年是text-to-image(文字到圖像)蓬勃發展的一年,我們看到了AIGC逐步出圈,不再是學術圈一小撮人自娛自樂的狂歡,而變成了真正民治、民享的產品。
前不久知名網路作家「和菜頭」專門寫了一篇專欄分享他使用AI畫畫軟體的心得,想來AI畫畫的影響已經逐步擴散至插畫師們、數位藝術家們、遊戲畫師以及廣大的內容創作者們了。
因為AI畫畫確實畫得更好了、更好用了、更方便了,其速度和質量已經超過大部分人類,所以AI畫畫才能出圈,才可以實現AI全民化。
三、AI會不會取代創意類工作?有什麼影響?
最後聊聊所有人都會關心的問題,AI畫畫全民化了,那我們怎麼辦?所有內容創作者、數位藝術家們怎麼辦?我們會被取代嗎?
首先,我們要肯定技術進步帶來的社會進步,整體來說我們大部分人會因此受益。因為畫畫的門檻變低了,或者說人們獲得一張好看的、自己腦海中的畫面的成本很低。我們不用再去像是達·芬奇畫雞蛋那樣,一張一張地重複打磨基礎也可以獲得一張很漂亮的畫作。
比如說,對於前面提到的產品經理或者是文字作家,完全就可以通過「AI畫畫」能力,直接文字描述獲得想要的畫面,穿插於自己的作品中,提升創作效率,也增加讀者和用戶的可讀性,提高內容表達豐富性。
內容生產力效率提升還能帶來什麼呢?往大了說,能加速人類文明蓬勃發展。舉個例子,放在古代,沒有造紙術的時候,人們靠牛車拉滿車竹簡刻的書上所包含的信息量和你今天手機上的內容量,哪個更多?
而且現在人們每個人都能獲得這些信息,每個人都可以創作更好的內容,「AI畫畫」為人類文明載入了助推器也不為過。
其次,AI畫畫促進了相關產業的發展,同時也創造了與之相關的新的崗位。比如現在很多科技大廠都在重金投入智慧創作,而智慧創作的核心就是「AI創作」,除了AI畫畫、AI寫詩、AI剪輯視頻、AI驅動虛擬頭像、AI換背景等等,AI創作還能做什麼呢?如何讓用戶更喜歡用,更好用呢?
AI創作需要產品經理定義產品需求、用戶場景,需要開發人員開發相關應用,當然也需要演算法人員在相應的細分用戶場景上進一步調優:大模型雖好,但不能包治百病。產業發展起來了,需要上下游參與的人越來越多,自然也創造了很多就業崗位。
當然除了2D靜態的創作,AI還可以進行視頻的創作,比如前不久剛從Tesla離職的計算機視覺大牛AndrejKarpathy就上傳了自製的python學習課程,裡面的視頻內容就全部都是stablediffusion創作的。如果你是一個知識視頻up主,不願意露臉也不太會各種複雜的剪輯,通過AI創作就可以讓很多不會做視頻的人群瞬間具備了做視頻的能力,普通人也可以參與到視頻創作的工作中來,賺取相應的收益。
AI同樣可以創作3D的物體或者是人物形象,現在很多3D遊戲里的場景和人物已經是AI批量生成的了,元宇宙的場景中同樣也需要大量的3D素材,如何使用AI將其創作出來,其實也是一個技術活。
此外還有AI畫畫衍生出來的一些工種,比如有的人會通過讓AI創作出來不同畫風的高清/4K/8K壁紙,看哪類型的壁紙受益好,放到相應的壁紙網站上賺取受益,同理也可以製作短視頻,在短視頻平台上養號,賺取收益。
說完C需求,我們看看B端需求。現在很多廣告已經不再是「人」來製作了,而是直接讓AI來創作,AI學習各種用戶點擊率高、轉化率高的廣告,可以更加快速地編輯生成滿足廣告主爸爸們需求的廣告,而且甚至可以根據不同的投放渠道,不同的目標人群進行相應的調整。這背後當然也需要大量的演算法同學、產品策略同學等等來支持維護,AI創作才能發揮其最大的效益。
那些畫家或者是藝術創作者呢?他們要擔心被AI取代工作嗎?我覺得還好,每個人的風格大不相同,而且藝術家最最核心的能力在於打造屬於自己的風格,而不是去臨摹追隨其他人的風格,而風格的創造和定義是人類獨一無二的,AI無法替代的。
未來藝術家們仍舊可以一邊潛心自己的創作和風格摸索,一邊調教AI,讓TA更好地學習你的創作風格,創作出同風格的更多作品,滿足更多的目標客戶,甚至未來的藝術品都可以千人千面。
比如有的人可能就想要黃色的「星空」、藍色的「向日葵」來裝飾自己的家,那麼藝術家當然完全可以將這類工作交給AI來處理。到那時,人投入時間和心血創作的作品肯定價值會更高,但是藝術家的產量也會總體增加,總收益和影響力都會極大地增加。
最後,想要打消大家的過度憂慮,每個科學技術的進步都會帶來巨大的社會變革是沒錯,但是我們不能因此拒絕或者是抵觸技術的進步。AI創作本質上是提升了人類社會內容創作的效率並降低了成本,間接可以讓文明更好的傳承。將人類從一些低效耗時的事情上釋放出來,向價值鏈更高處遷移。
原來已有的方式不會消亡,反而會變得更加珍貴。比如說工業革命之後,大家都用了工業品,極大地改善了生活品質,但是手工業並沒有消亡,而現在很多純手工打造的產品反而會更加昂貴,甚至很多奢侈品都會主打是純手工。
同理,未來,畫畫門檻便低了之後,人們可以欣賞到、體驗到更加精美的作品,但是也可以花更高的價格去買「純手工」的畫作。
畢竟AI並不能「誕生」畢加索、達利、米開朗琪羅、哥白尼、牛頓,但是人類可以。既要踏入無人之境,就請擁抱變化和未知吧,請對科技擁有更多善意和信心。
專欄作家
大仙河,公眾號:大仙河知識學堂,人人都是產品經理專欄作家。7年AI產品相關經驗,專註AI產品化(元宇宙、數字人、全息通信等)領域,致力於構建人工智慧學術和工業界的橋樑。
本文原創發佈於人人都是產品經理,未經許可,禁止轉載。
本文為人人都是產品經理《原創激勵計劃》出品。
題圖來自Unsplash,基於CC0協議
該文觀點僅代表作者本人,人人都是產品經理平台僅提供信息存儲空間服務。