編輯導語:AI人工智慧的發展逐漸讓人們對未來有了更多元化的想象,尤其當AI進入極富創意化的領域時,AI是否能帶給人們不同於以往的內容?本篇文章里,作者就AI創作對內容創作領域產生的影響進行了分析,一起來看一下。
林黛玉葬花之時曹雪芹亂入,並與寶玉、襲人發生一場持續千年的世紀大戰;鴻門宴再現,項羽喊著「偉大與光輝」與樊噲打作一團、而後項莊趁亂刺死劉邦;孔融讓梨引發一場長達十多年的報復和最終精心謀划的血案;《桃花源記》中善良淳樸的村民竟會為了保守桃花源的秘密而設計害死漁民……
這些熟悉而又陌生的內容,並不是網友們對經典文學作品的惡搞,而是來自於AI的故事續寫。
今年以來,由AI續寫故事作為文本的視頻在B站悄然流行開來,一些UP主利用市面上的AI創作應用續寫人們熟知的文學作品,再將新的作品以人聲演繹,配上BGM后製成視頻。
經過AI的一頓操作,名著成了爆款爽文,前有諸葛亮開戰鬥機,後有莊子研究「三體」,各種平行世界信手拈來,AI一本正經胡說八道的本事,比過去的地攤文學還強。
其實,對於相關工具的使用者而言,用AI進行創作並沒有技術門檻:只需輸入文學作品的某些片段,AI創作機器就會根據給定文字的內容與風格對故事進行續寫,這些經過AI二次創作的故事,往往情節曲折離奇,與原作的走向大相徑庭,這種內容因為反常規和新鮮感而受到一些網民的追捧。
不過話說回來,藝術創作這種高度創意化、個性化的工作,原本被視為「人類的最後一片凈土」,是理論上最不可能被人工智慧取代的工作之一,可如今人工智慧技術的發展卻為藝術創作開闢了一條新的捷徑。本期全媒派(ID: quanmeipai)帶來一篇文章,探析AI創作正在對內容創作領域產生怎樣的影響。
一、AI寫作是怎麼回事?
AI創作也就是機器人寫作,這是一種擬人化的說法,實質上是指通過一定的計算機程序,對輸入的信息進行自動化的分析、處理和加工,從而生成一篇較為完整的文章。總的來說,今天流行的AI續寫,其實已經算是比較成熟的能力。
隨著人工智慧技術的快速發展,自然語言生成(natural language generation, NLG)技術在世界範圍內得到廣泛的應用。《紐約時報》和美聯社等新聞機構都曾採用NLG技術來撰寫新聞報道;僅在2014年,技術公司Automated Insights就實現了以每秒超過2000篇的速度生成新聞報道,全年發布新聞共計10億多篇。[1]
AI寫作背後的原理非常複雜,其核心是自然語言處理(natural language processing, NLP)技術,同時涉及到數據挖掘、機器學習、知識圖譜等多項人工智慧技術。自然語言處理是指讓機器擁有理解並解釋人類語言的能力,目標是讓機器在理解語言上像人類一樣智能,最終彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距。[2]
自然語言處理(NLP)涉及兩個流程,分別是自然語言理解(natural language understanding,NLU)和自然語言生成(NLG)。市面上的寫稿機器人大都是NLG系統,目前主要有模板式、抽取式和生成式這三種技術方向。[3]
模板式寫稿機器人主要通過優化演算法,在預先存儲的大量寫作模板中,選擇與給定材料相匹配的模板,將信息加以組合生成文本,是目前應用最成熟、實現最容易的一種機器寫作方法。
抽取式機器人會對文本進行語義分析,識別冗餘信息,抽取重要內容,通過摘錄或概括的方法壓縮文本,形成對於既定文字的摘要,再加以計算確保文摘的連續性,這種技術廣泛應用於新聞內容概括和文摘生成。
生成式NLG主要通過深度學習和增強學習技術實現,機器通過大量的文學作品樣本進行訓練,學習各類寫作風格、建立寫作模型,再根據輸入的文字片段獲知任務需求,預測並生成與需求相匹配的文稿,進行輸出。
從現階段來看,模板式和抽取式寫稿機器人的技術已經趨於成熟,在市場上得到了廣泛的應用;生成式NLG技術更加智能,也是當前NLG技術中更為高級的目標,OpenAI等研究機構在這方面做出了嘗試,並在市場上得到了應用。
二、我們身邊的AI寫稿工具人
AI寫作在當今社會早已不是什麼新鮮事,早在2011年,《洛杉磯時報》就開始研發麵向地震領域的自動化新聞生成機器人Quakebot。2013年3月,Quakebot因率先報道南加州發生的4.4級地震引發關註:2014年3月,美國洛杉磯發生4.4級地震,Quakebot用時3分鐘就完成了相關報道的寫作和發布。
同年7月,美聯社引進Automated Insights公司開發的新聞寫作機器人,開始使用自動生成新聞技術。此後,《紐約時報》《華盛頓郵報》《衛報》和路透社等媒體都走上了自動化新聞發展的道路。[4]
Quakebot近期發布的新聞。圖片來源:《洛杉磯時報》
國內在自動化新聞領域也有許多嘗試:2016年5月,四川綿陽發生4.3級地震,中國地震台網研發的地震信息播報機器人用6秒寫下560字的速報,報道內容翔實;2017年8月,該機器人在第一時間報道了四川阿壩州九寨溝縣的7.0級地震,引發廣泛的討論和關注。
這條新聞消息約540字,新聞涵蓋了速報參數、震中地形、熱力人口、周邊村鎮、周邊縣區、歷史地震、震中簡介、震中天氣8個方面的內容,並配有5張配圖,用時僅25秒。在此後的餘震報道中,新聞機器人最快出稿速度僅有5秒。[5]
地震信息播報機器人對九寨溝地震的報道
除了新聞報道以外,AI寫作也在其他文字創作場景得到了廣泛的應用。目前,無需人工干預的機器人寫作可以生成詩歌、廣告、各類行業分析報告、歌詞、小說、甚至劇本。
以詩歌為例,微軟研發的機器人小冰於2017年出版了詩集《陽光失了玻璃窗》,這是歷史上第一部人工智慧詩集,其中包含139首現代詩。[6]
諸如「快把光明的燈擎起來了/那裡有美麗的天/問著村裡的水流的聲音/我的愛人在哪/因為我的紅燈是這樣的幻變/像是美麗的秘密/她是一個小孩子的歌唱/那時間的距離」的華麗辭藻還頗具美感,只是在邏輯性上有所欠缺。除了現代詩,律詩、藏頭詩、詞等各種風格的詩歌創作軟體已然在市場上層出不窮。
相比於新聞,故事、小說等連續語義的創作會更加困難,而這些也早已不是難題。早在2016年的倫敦科幻電影節上,紐約大學研究人員開發的機器人Benjamin創作了一部長達9分鐘的科幻電影Sunspring,贏得了大批關注;MIT媒體實驗室開發的機器人Shelly專職撰寫恐怖故事,並在Twitter更新;Botnik研究室採用預測的演算法創作了《哈利波特》的續集。
三、除了寫稿,AI創作還有其他形式
當AI創作技術應用於寫稿,可以誕生機器版的記者、小說家、詩人、編劇等,而當它應用於繪畫、音樂和舞蹈領域時,則可以「培養」出畫家、作曲家和編舞人員。
1. AI繪畫創作大放異彩
利用機器繪畫早已寫入了人類的夢想清單:早在18世紀70年代,瑞士已經有人利用機械臂繪畫;2016年,谷歌研發的繪畫AI在舊金山拍賣會上大放異彩,其作品一度拍出單幅8000美元的高價;2019年,微軟小冰獨立完成的原創繪畫作品在中央美術學院美術館展出,並於2020年推出個人繪畫作品集。[7]
2. AI音樂創作譜寫別樣樂章
AI在音樂創作中的應用比比皆是:2016年,索尼公司計算機科學實驗室CSL的DeepBach項目仿照巴赫的風格創作的合唱曲目,被專業音樂家誤認為是巴赫的作品。
除了譜曲,AI 還可以創作可以唱出聲音的歌曲,CSL實驗室的機器人Flow Machine模仿披頭士的風格,自主創作了歌曲Daddy』s car。法國計算機科學家Pierre Barreau創造的作曲AI應用Aiva可以根據需求創作不同風格的音樂,甚至可以根據圖畫作曲,Aiva也於2017年成為「法國及盧森堡作曲家協會」(SACEM)的首個非人類會員。
3. AI舞蹈創作演繹非凡舞曲
有不少團隊開發了舞蹈創作類的AI:谷歌研究院建立了名為AIST++的3D舞蹈動作數據集,據此訓練的AI能夠根據給定的音樂和一段2秒左右的種子動作生成長序列的逼真的3D動作。
目前已有的舞蹈創作AI基本都能根據目標音樂生成與之匹配的舞蹈動作,並通過3D建模的方式將舞蹈進行表演。經過模型構建方法的迭代升級,AI生成的3D舞蹈在動作質量、動作多樣性和動作與音樂的相關性方面均有著還不錯的表現。
AIST++舞蹈數據集的示例。圖片來源:https://arxiv.org/pdf/2101.08779.pdf
OpenAI公司最新推出的GPT-3模型,則開放了API服務,申請者可以調用GPT-3的API,將其進一步開發為論文翻譯工具,網頁生成工具,前端設計器,聊天機器人甚至遊戲開發工具。在GPT-3的身上,我們看到AI從某一個領域的創作者成為各方面兼修全才的可能性。[8]
四、AI作為內容生產者還有哪些缺陷?
AI創作固然強大,但要想做到大規模的普及和落地,尚有一些問題橫亘於我們面前。
首先就是AI的價值判斷問題。機器學習只是提取訓練集數據的風格特徵,並對這種加以模仿,機器看似具有「學習」功能,實質上仍落入了按圖索驥的窠臼。
AI本身對文本創作並沒有價值判斷,所以在AI生成的故事當中,我們可以讀到諷齊王納諫的鄒忌為了保住權勢富貴而出賣小妾,讀到為孩子買橘子的父親在月台摔倒暴斃……這些離奇的情節不僅與邏輯不符,對正常的價值導向也難以判定。如果訓練內容存在問題,或者某些用戶輸入時刻意引導,AI生成的內容在倫理道德方面的處境更會雪上加霜。
其次是AI創作的版權問題。在當前技術框架下,AI的訓練效果在很大程度上取決於語料庫,沒有足夠量的語料庫,AI便無法進行學習,更無法進行創作。
那麼AI產出的作品該歸語料的作者還是歸AI的創作者所有呢?如果歸語料作者所有,那麼又如何為龐大的網路語料資源劃定作者呢?如果歸創作者所有,又能否將使用了相同技術線路和演算法的創作者視為抄襲?這些問題仍然需要法理和倫理上的探討。
最後便是AI使用者的問題。
AI為內容創作提供了一種更加輕鬆、便利的可能性,但在一些別有用心的人眼中,AI成為了助長抄襲的洗稿工具:輸入一段語句,AI就會對語言結構進行重組,對關鍵詞加以替換,從而在短時間內複製網路爆文……技術雖為中立,但不良的使用意圖讓技術成為了幫凶。
自AI誕生之日起,有關於AI取代人工的憂慮便不絕於耳。顯然,由AI續寫的故事雖然有點扯,但終究還是能滿足一部分人的內容消費需求,甚至有走紅的潛質。至於智能機器與內容創作者的關係,終歸還是會走向人機協作、共生共進,而不是相互取代、零和博弈。
參考鏈接:
[1]https://www.sciencedirect.com/science/article/pii/S074756321930398X
[2][3]https://www.sohu.com/a/194437537_644338
[4][5]https://baike.baidu.com/tashuo/browse/content?id=121b5b2a75f6065bb9eeb3e4
[6] https://www.yubaibai.com.cn/article/5610496.html
[7] https://blog.csdn.net/qq_41731283/article/details/108825436
[8] https://new.qq.com/omn/20200724/20200724A07WET00.html
作者:李秀;公眾號:全媒派(ID:quanmeipai)