AI人工智慧的身影已經越來越常見,從AI主播、到AI繪畫,又比如本文中的AI配音,越來越多領域開始應用、結合AI,與此同時,AI人工智慧的應用也讓不少人產生疑惑:在未來,AI可以代替真人完成某些事情嗎?如果可以的話,又可以完成哪些呢?
在原定錄音工作無法完成的情況下,為了保障重要遊戲資源的完整,臨時調整計劃或更換CV並不少見。近日,因為負責當期內容的配音演員無法參與錄製,《時空中的繪旅人》和《未定事件簿》也相繼發布了角色更換配音的公告,不過,這次並不是換人,而是用AI配音替代真人錄製。
AI配音不稀奇,但AI配音遊戲角色,還是配乙女遊戲中的男主之一,確實是個新鮮事。除了引發粉絲和吃瓜群眾對背後的內情的探究,這一嘗試也讓遊戲玩家既期待又忐忑不安。不過,隨著語音在遊戲中實裝,以及相關實機視頻的公布,語音最終呈現出來的效果卻出乎玩家的預料:
也有被新嗓子俘獲,情緒較為激動的:
雖然存在缺陷,但總體來說並未翻車,反而算得上是驚喜。
一、AI配音正在大步向前
AI配音,似乎在逐漸顛覆大眾的普遍印象:
雖然與早期的小冰等相比,現在的智能語音助手,在語言流暢度上已經有了很大的進步,也有了更為豐富的聲音方案,但大部分時候,智能語音助手、AI聽書、短視頻AI配音等,仍然扮演著沒有感情的念稿機器,還會在斷句、特殊句式、多音字上屢次碰壁。而早期作為虛擬歌手標配的機械感和電音,隨著聲庫和調音技術的升級,也逐漸被削弱。創作者還會特意加入換氣聲,使之更貼近於真人。
與唱歌不同,除了流暢,語氣和情感也是配音的重點。短視頻中的AI配音之所以讓人覺得「莫的感情」,是因為只滿足了基礎的發音流暢,並沒有語氣變化與情緒起伏。
不過,在AI聽書這一領域,似乎已經有了一些效果,如微軟TTS中文語音、火山語音等,除了銜接自然,在朗讀過程中也會有明顯的輕重緩急。常被網友用來整活的番茄AI讀書(火山語音),在識別到一些具有情緒色彩的內容,語速和語氣會有變化——儘管情緒不一定能對應上,且極易會受到符號影響卡出鬼畜音頻。
雖然好笑,但確實是生動起來了。
在許多人對AI語音的印象還停留在探索階段時,《繪旅人》和《未定》則在語言銜接、語氣以及情緒上,展現出了高度貼合真人的成果,當然,距離完美還有提升空間。
在評論區,玩家的評判標準也反覆橫跳,一方面知道是AI后忍不住開始找毛病,另一方面又認為不應該對AI太過嚴格。
不過,鑒於這是兩個人第一次「學說話」,評價大體上還是包容居多,甚至自發尋求合理性,比如莫弈的略微氣虛契合了劇情設定下的曖昧氛圍,葉瑄的微妙停頓以及電流聲,恰好可以歸於「外星人」設定。
還原本音外,此次AI配音的另一個特殊之處,在於音源來自於角色而非CV。
無論是虛擬歌手,還是智能語音助手,大都是由真人提供音源。因此對於AI語音,特別是即時生成的語音來說,聲庫質量尤為重要。即使是虛擬歌手,其歌曲效果,也不只取決於調校水平。
但《繪旅人》和《未定》中,葉瑄和莫弈這兩個角色,並非由CV直接提供音源,而是通過角色過往的配音來分析提取聲紋,也就是說,這是葉瑄和莫弈「自己給自己配音」。
涉及到的兩個AI技術提供者,在這之前也已經在其他領域中大展身手。網易AI Lab曾在去年與《羊城晚報》合作推出廣東媒體首個視頻類真人AI合成主播「羊小晚」和「羊小派」。
至於逆熵AI,在前段時間米哈游旗下虛擬偶像鹿鳴的直播上,就引發過討論,在幾年前公布時,也對AI配音這方面做出了解釋,即深度學習記錄配音演員的聲音和情感,做到輸入文字就能夠生成語音。也是由於這一項技術的經驗,相較於準備時間較為倉促且第一次嘗試的葉瑄,莫弈的配音才能呈現出更好的效果。
相似的原理,在虛擬歌手身上也得到了應用,8月末,洛天依AI在軟體ACE Studio上開啟公測,同樣是通過深入學習來模擬真人發聲效果。
在視頻平台上,也有網友將洛天依AI聲庫與此前的V3、V4聲庫進行對比,相比之下AI聲庫呈現出來的歌曲片段,在流暢感和真人感上都有很大的提升,更為自然柔和。不過也有網友認為這樣失去了洛天依特有的標誌性電音。
洛天依聲庫的加入,無疑讓ACE Studio進入了更多網友的視野,而除了調音,這一虛擬歌姬軟體的捏聲線功能也為創作者帶來了更多的靈感和途徑:
在選定模板的基礎上,通過調節參數得出聲音「配方」后,給人的感覺基本就像是角色本人在唱歌了。
但無論是真人音源還是虛擬音源,由於AI的可調性,AI語音呈現出來的效果和真人也有著微妙的差異。這在虛擬歌手上比較常見,在聲線和語氣上已經高度還原的莫弈身上,也會產生一種角色和CV分離開來的感覺,給人的感覺像「貼莫而不貼姜」。
而神奇的是,這種與真人稍微剝離的感覺,似乎並不會讓玩家不滿,反而讓他們更有代入感。
二、AI會代替真人配音嗎
使用AI配音的直接目的,是避免因為外界因素而導致超出計劃的變動。不過,這也受到角色定位的影響,近兩個月中,其他遊戲里也有姜廣濤配音的其他角色出場,如《花亦山心之月》中的玉澤和《食物語》中的龍井蝦仁,但除了提前錄好的部分,在其他內容中暫時成為了「啞巴」。
這些角色雖然也有高人氣,總歸只是眾多角色中的一個,在時裝及其劇情的暫時失聲並沒有太大的影響,但作為乙女遊戲的男主角之一,葉瑄和莫弈在活動劇情中缺席或失聲,都會對角色塑造和玩家體驗上產生嚴重的負面影響。
而在局勢尚未明朗的當下,更換CV也確實不合適,因此,使用AI配音,便成為了最優解。
AI會替代真人配音嗎?對此網友的態度也各不相同,有人認為AI配出來的沒有靈魂,有人則認為紙片人就應該配電子音:
不過,就當下的情形來看,短時間內這樣的可能性不大。
主要是在於技術與成本。人工智慧的使用,很大程度上是為了降低人力成本,但應用的範圍也有限。當前AI配音主要應用於不需要太多情緒的短視頻文案、新聞播報、聽書功能上,滿足基本的信息傳達功能。
而更為複雜的有情緒的AI配音,在這些領域是不適用的,也不必要的。因為AI配音的相對低的成本,並不包括像《繪旅人》和《未定》這樣給主要角色臨時配音的情況——不僅要考慮語言流暢、還要在語氣情緒上貼近角色,以及盡量還原配音演員。在技術要求和工作量上,這無疑是高於真人配音的,也並非所有的遊戲都能擁有網易米哈游兩家大廠在資金和技術上的支持。
而對於合作雙方來說, 除了與角色的適配度,CV本身的影響力,也是遊戲廠商考慮的重點。雖說將角色與配音演員聯繫在一起並不好,但這種現象依舊是普遍存在,否則也不會將CV作為宣傳點,並舉辦CV和玩家的互動活動了。這些附加效應,自然也是真人配音的高成本中的一部分。而廠商要創造獨家AI CV,再將其打造成為IP,擁有與頭部CV相當的號召力,並不是能一朝一夕完成的。
此外,AI配音技術尚未完全成熟。
而且,比起情感,AI配音更多的是擁有了情緒,而這些情緒是通過一點點的後期調節來實現的。相對於真人,許多時候數據或許會少了一些打動人心的力量。比如視頻創作者的小情緒、發音習慣、甚至是偶爾的口胡,都能拉近與觀眾的距離,這是追求完美的的AI配音無法實現的。
雖然對頂級的CV沒有太大的影響,但對於許多在業務能力和知名度上較低的配音工作者來說,AI配音的不斷進步確實會有威脅,比如現在的AI聽書已經開始擠佔有聲書市場了。但這也並非完全是壞事,競爭會推動配音演員對自身技能的提升。不過,這一問題並非面向個人,而是需要整個行業進行調整,提升真人配音的競爭力來應對危機。
三、結語
AI配音遊戲角色,讓人們看到了這一技術在語音領域的又一次進步。在感慨人工智慧技術的越來越強大的同時,也擔心會帶來虛假信息、擠佔市場、剝奪創造力等社會問題。此前的AI換臉、AI繪畫,也是如此。
但就如機械代替部分人力一樣,AI在更廣泛領域得到應用的趨勢是不可阻擋的,我們只能通過法規等來規避其隱患,而無法阻止它。但能替代的,也只是一部分,至少在目前,AI配音的應用範圍還十分有限,而在技術成熟和成本降低的未來,局面或許會發生改變。
不過,即使是AI技術在未來達到了突破性進展,我也更願意相信,將AI作為輔助工具,協助真人CV完成各類配音工作,並在這一過程中互相學習促進,才是最理想的結果。
作者:寸草,來源公眾號:手游矩陣(ID:shouyoujuzhen)
原文鏈接:https://mp.weixin.qq.com/s/x4adQ55zkUglYuQIq66SQg