10月8日,韓國新人歌手夏妍發(fā)布了由人工智能作曲機器人EvoM制作的單曲《Eyes on you》,成為全世界第一位憑借AI作曲出道的人類歌手。
EvoM是韓國光州科學技術院人工智能研究生院研發(fā)的韓國首個人工智能作曲機器人,在《Eyes on you》的錄制中負責作曲、編曲工作。EvoM的研發(fā)者安昌旭表示,他的目標是讓人工智能創(chuàng)作的歌曲登上K-POP排行榜。
啟航-音樂生產(chǎn)自動化的野心
早在上個世紀,人類就開始探討計算機獨立制作音樂的可能性。1956年,在列哈倫·希勒(Lejaren Hiller)的研究室里,世界上第一首完全由計算機生成的音樂作品--弦樂四重奏《伊利亞克組曲》(Illiac Suite)誕生了。1995年,阿爾佩(Alpern)研發(fā)的EMI作曲系統(tǒng)也是較早的一個成熟的古典音樂作曲系統(tǒng),該系統(tǒng)主要采用拼接的方式來創(chuàng)作再現(xiàn)已故作曲家音樂風格的作品,其中有類巴赫的創(chuàng)意曲、器樂協(xié)奏曲和組曲,還有類莫扎特的奏鳴曲以及類肖邦的夜曲。
隨著人工智能相關技術的發(fā)展和普及,近年來,越來越多企業(yè)和機構開始研究這個科技與藝術結合的奇妙領域,各式各樣的作曲算法不斷涌現(xiàn),不少虛擬音樂人展露頭角。“智能相對論”梳理了下:
2016年,Google公司研發(fā)的機器學習項目馬真塔(Magenta studio)通過神經(jīng)學習網(wǎng)絡創(chuàng)作出一首時長90秒的鋼琴曲。同年,Sony旗下的計算機科學實驗室(Computer Science Laboratories,簡稱Sony CSL)開發(fā)了Flow Machines平臺。Flow Machines利用馬爾科夫鏈分析數(shù)據(jù)庫中現(xiàn)存的歌曲,提取旋律及和弦的關鍵信息,利用這些關鍵信息作為變量來學習音樂風格,讓不同風格的歌曲相互轉換、融合,并加以優(yōu)化,其代表作是一首披頭士音樂風格的歌曲《爸爸的汽車》(Daddy's Car)。此外,Sony CSL還開發(fā)了一個名為“DeepBach(深度巴赫) ”的神經(jīng)網(wǎng)絡,利用巴赫創(chuàng)作的352部作品來訓練DeepBach,最終完成2503首贊美詩的創(chuàng)作。
第一個正式獲得世界地位的AI虛擬作曲家則是2016年誕生的AIVA(Artificial Intelligence Virtual Artist)。AIVA通過讀取由莫扎特、巴赫、貝多芬等名家譜寫的15000首曲子進行學習,利用深度學習技術,搭建體現(xiàn)它自己對音樂理解的數(shù)學模型,運用模型創(chuàng)作出完全原創(chuàng)的曲子。作為虛擬音樂人,AIVA已通過法國和盧森堡作曲家協(xié)會(SACEM)的合法注冊,成為該協(xié)會首位非人類會員,并擁有自己的署名版權。
今年2月,美國數(shù)字研究機構Space150模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了說唱機器人Travis Bott。這是一個關于人工智能創(chuàng)造性的實驗,研發(fā)團隊采用附加神經(jīng)網(wǎng)絡技術(Additional Neural Network),創(chuàng)造出“Travis Scott味”的旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入“文本生成器模型(Text Generator Model)”,得到了機器自動仿照Travis風格生成的歌詞。于是,Travis Bott完成了自己的創(chuàng)作--《Jack Park Canny Dope Man》。最后,研發(fā)團隊使用基于AI的人體圖像合成技術“Deepfake”,為這首歌拍攝了MV。就樂曲效果而言,Travis Bott對Travis Scott的模仿幾乎以假亂真,完全融匯了Travis Scott作品以及人物魅力最主要的外部特征。同時,該項目也進一步驗證了人工神經(jīng)網(wǎng)絡技術(Artificial Neural Networks)的蓬勃發(fā)展,有助于探索未來AI在音樂中的應用價值。
造船原理-幾種算法模型
現(xiàn)代人工智能作曲技術背后蘊含了多種算法模型的結合運用,包含人工神經(jīng)網(wǎng)絡、馬爾科夫鏈及遺傳算法等。如AIVA和Travis Bott就使用了一種基于人工神經(jīng)網(wǎng)絡的深度學習技術。
人工神經(jīng)網(wǎng)絡是一種對生物神經(jīng)的網(wǎng)絡行為特征進行模仿,開展分布式并行信息處理的算法數(shù)學模型。程序員必須搭建一個多層“神經(jīng)網(wǎng)絡”,在多層的結構中分別加以編程,從而處理各種輸入和輸出點之間的信息。作品數(shù)據(jù)輸入后,人工神經(jīng)網(wǎng)絡會找到眾多被輸入作品之間存在的規(guī)律,繼而形成對音樂旋律、節(jié)奏、音高、強弱變化的理解與學習。這種學習的主要目的是用來預測,并非就此生成作品。AI程序會帶著它對以上音樂風格的預測繼續(xù)運行,并將在前方遇到下一個驗證數(shù)據(jù)集。這個數(shù)據(jù)集會判定它的預測是否正確,正確與錯誤的回饋都將被AI記住。
在不斷的高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數(shù)據(jù)歸總后的曲風,進而編寫出自己的曲子。人工神經(jīng)網(wǎng)絡為從前的算法作曲提供了一種新的方式,其優(yōu)勢在于能夠對音樂作品的全局性特征進行學習,但是需采用大量的樣本進行訓練。當下國內外有許多基于該種算法所形成的人工智能作曲系統(tǒng),如LSTM神經(jīng)網(wǎng)絡,可以確保所創(chuàng)作音樂的完整性。
除了人工神經(jīng)網(wǎng)絡,馬爾科夫鏈(Markov Chain)也一直被廣泛地應用于算法作曲領域。馬爾科夫鏈是一種隨機選擇過程,主要用于產(chǎn)生一段具有一定風格的旋律。就像按照一個特定的標準人為構造制定的轉換表來依次選擇音符,計算并選擇下一個要出現(xiàn)音符的可能性。這種方法可以模擬作曲家創(chuàng)作音樂時的思維,來控制計算機生成相應的音樂作品,但是整部作品的曲式結構無法通過馬爾科夫鏈建模。遺傳算法(Genetic Algorithm)則是模仿生物進化過程的智能計算方法,使用適應性函數(shù)來演化樣本、優(yōu)化全局。
其中,變異算子可以模擬人在其創(chuàng)作當中靈感的閃現(xiàn),相當于留下最具代表性的作品來產(chǎn)生新的旋律。該算法的壁壘在于適應性函數(shù)的設計至今尚無統(tǒng)一標準。
版權的“暗礁” 依然是AI作曲要面臨的主要問題
由于AI音樂的產(chǎn)生是根據(jù)算法模型,讓計算機在大量現(xiàn)成作品中尋求“規(guī)律”,按照這些規(guī)律提取資料中特定的樂章片段,依據(jù)計算得出的概率重新進行排列組合,故人工智能作曲必然涉及到資料庫中大量現(xiàn)成作品的版權問題。
AI如何判斷研究人員提供的曲庫中哪些作品收到版權保護?AI作曲成果是否侵犯學習對象的版權?如AIVA最初以古典音樂為學習對象,它所使用的莫扎特、貝多芬等人的作品歷史久遠,版權時效已過,故沒有此類問題。AIVA研發(fā)人員特意選擇古典音樂為其學習對象,主要就是為了避免版權問題。但像Travis Bott所用的Travis Scott人物及作品相關資料皆需取得授權,而Travis Bott在此基礎上創(chuàng)作的作品算不算對Travis Scott的抄襲?音樂作品抄襲的議題屢見不鮮,相關討論仍然不時出現(xiàn),至今依然沒有統(tǒng)一、明確的判斷標準。從版權問題可見,現(xiàn)在的人工智能作曲技術依托于算法,受限于曲庫的音樂“規(guī)則”,還無法產(chǎn)生突破既有規(guī)律的作曲創(chuàng)意,此為AI作曲面臨的另一個技術難題。
即便AI作曲技術經(jīng)過不斷優(yōu)化,最終得以生產(chǎn)出純原創(chuàng)、不涉及任何侵權的作品,此作品又將面臨到版權認證的問題。隨著AI創(chuàng)作相關技術的成熟與普及,一些國家開始在法律上明確界定AI作品的版權歸屬。
1988年,英國正式頒布了《版權、設計和專利法案》(Copyright,Designs and Patents Act 1988),其中,對于計算機創(chuàng)作的內容進行了明確的規(guī)定:“為計算機所生成之作品進行必要程序者,視為該計算機生成之作品的作者,其保護期限是自作品完成創(chuàng)作之年的最后一日起50年后屆滿”。規(guī)定AI作品的版權屬于“進行必要程序者”,同時也明確界定了對計算機生成作品“進行必要程序者”,即包括程序員、使用者,也可能是人工智能系統(tǒng)或設備的投資者。
2017年,世界知識產(chǎn)權組織(WIPO)雜志提到:如果一部作品的創(chuàng)作過程中“人類的參與有限,或根本沒有人類參與”,著作權法可以有兩種潛在的生效方式--著作權法可以“拒絕”對計算機生成的作品進行版權保護,也可以將此類作品的作者歸屬于程序的創(chuàng)建者。現(xiàn)在國內解決此類問題也基本沿襲這個思路。
2018年,上海一家公司未經(jīng)過授權,將騰訊開發(fā)的自動化編寫程序Dream writer生成的財務報告復制到該公司網(wǎng)站。深圳市南山區(qū)法院裁定,該公司因侵犯騰訊的版權而需承擔民事責任,向騰訊公司賠償1500元人民幣。中國現(xiàn)行的《著作權法》尚未明確界定AI作品的版權歸屬,這一裁定可能是AI創(chuàng)作領域的重要里程碑?!吨鳈喾ā?“著作權是著作權法賦予民事主體對作品及相關客體所享有的權利。”其中,民事主體指公民、法人或非法人組織。《著作權法》保護的對象是作為民事主體的獨創(chuàng)性思想表達,并非民事主體的AI無法單獨享有著作權,但只要在作者名錄加上人類作曲家或研發(fā)者的名字就能解決此問題。人工智能雖無法成為受法律保護的主體,但對其作品版權的保護也開始受到法律認可。
沒有感情的輔助器-方舟的航向
人工智能作曲技術的日漸成熟,在音樂行業(yè)掀起一股不小的浪潮。盡管人工智能已經(jīng)實現(xiàn)通過讀取、記憶大量樂曲獲取規(guī)律,計算音符節(jié)奏的出現(xiàn)概率并排列組合來“創(chuàng)造”音樂。但音樂的核心并非音樂本身而是“人”,音樂源于人類情感流動。《禮記·樂記》對音樂起源的解釋非常貼切:“凡音之起,由人心生也。人心之動,物使之然也。感于物而動,故形于聲;聲相應,故生變;變成方,謂之音。”作曲家和演奏者透過旋律、節(jié)奏表達的情緒與觀眾聆聽音樂引起的共鳴,這種藉由音符實現(xiàn)的,跨越時間、空間與種族的情感交流才是音樂存在的意義,也是莫扎特、貝多芬等音樂家流芳百世的根本原因。
從某種角度來說,由于音樂是人類抒發(fā)心情的一種方式,讓沒有感情的人工智能作曲或許可以說是一個偽命題。人工智能不具備情感,不了解音符、節(jié)奏等音樂表層結構和基于情緒表達的音樂深層邏輯之對應關系,其制作的音樂只是基于概率所排列的音符。無論算法作曲技術發(fā)展得多么成熟,音樂作為人類情感交流的藝術形式之一,AI所作的樂曲必然無法完全取代人類音樂作品在社會中的功能和角色,人工智能也無法替代行業(yè)內頂尖的音樂創(chuàng)作者及表演者。不僅是音樂,在美術、文學等藝術創(chuàng)作中皆是如此。
現(xiàn)在較為成熟的AI音樂公司除了Google、Sony、AIVA外,還有英國的AI Musical、德國的Melodrive、美國的Humtap、Popgun、Snafu Records及諸多硅谷大亨聯(lián)合建立的人工智能非營利組織OpenAI、字節(jié)跳動旗下的Jukedeck等。百度、騰訊、阿里、網(wǎng)易云等音樂平臺都在不同程度上對人工智能音樂有布局。即便人工智能暫時無法掌握樂曲中細膩的情感變化及流動,但基于計算機具備對大量作品進行數(shù)據(jù)處理、運算分析及排列組合的強大能力,使得人工智能編曲效率遠遠高于人類。在一些注重成本且審美要求不高的應用場景中,AI作曲占有明顯的優(yōu)勢。因此,一批專業(yè)度不足的音樂從業(yè)者可能面臨被淘汰的命運。
目前,人工智能作曲技術逐漸往商業(yè)應用與輔助創(chuàng)作的方向發(fā)展,“智能相對論”看到,其應用場景主要為視頻配樂、游戲配樂、電視預告片、商業(yè)廣告、發(fā)布會和電影等方面。
以非藝術場景的商用音樂為主要市場,打破了固有音樂市場關于成本及創(chuàng)作時間的限制。如上文提及的AIVA已開始為電影、視頻、電視劇制作音樂。微軟(亞洲)互聯(lián)網(wǎng)工程院開發(fā)的小冰樂隊能自動生成旋律和編曲框架,已為2020世界人工智能大會創(chuàng)作了主題曲《智聯(lián)家園》。由西電灃東人工智能與類腦感知產(chǎn)業(yè)技術研究院研發(fā)的Muses人工智能作曲系統(tǒng),基于GAN和LSTM的智能譜曲算法和視頻多元素提取算法,實現(xiàn)了視頻自助譜曲、智能仿曲和譜曲輔助智能等功能。通過對視頻進行內容物體識別、色彩分析和畫面節(jié)奏分析,生成合適的背景音樂;也可透過用戶輸入的仿曲或關鍵詞、語句啟發(fā)音符,產(chǎn)生類似風格的音樂。另有一款專門制作視頻配樂的AI Ecrett Music,通過識別不同的視頻主題、時間及情緒,對視頻配樂進行個性化編輯,為視頻制作者持續(xù)產(chǎn)生不同的音律。為創(chuàng)意要求較低、對價格較敏感的部分商業(yè)音樂創(chuàng)作提供了全新解決方案。
除此之外,人工智能作曲技術對音樂愛好者進行創(chuàng)作也起到了輔助作用。
2019年上線的“哼趣”APP就是一款基于人工智能的音樂創(chuàng)作工具,只需簡單哼唱,AI就會根據(jù)哼唱內容、音調、旋律生成一段完整的、悅耳的曲子,此外,還可對生成的曲子進行個性化編輯,一鍵選擇變換不同樂器、風格與時長。“哼趣”的核心原理是通過大量的樂曲訓練來形成一套完善的LSTM神經(jīng)網(wǎng)絡的方式。同時,算法團隊解決了MP3與MIDI格式的相互轉換和降噪問題,將人聲與機器可識別的MIDI語言進行轉化,再利用帶有音頻判定的神經(jīng)網(wǎng)絡進行樂曲生成。使用這類軟件或APP,不僅使得音樂創(chuàng)作更加便利快捷,也大大降低了普羅大眾創(chuàng)作音樂的門檻。對專業(yè)音樂人而言,比起原先需要通過MIDI鍵盤輸入旋律的創(chuàng)作形式,在很大程度上提升了工作效率,減少重復勞動,并降低了與制作方的溝通成本。人工智能作曲隨機生成的旋律也能在創(chuàng)作陷入瓶頸時,為使用者提供靈感,編曲工具的發(fā)展將使專業(yè)作曲家的創(chuàng)造力得到進一步釋放。
結語
AI作曲技術讓音樂產(chǎn)業(yè)鏈運作更有效率,人工智能創(chuàng)作的歌曲登上K-POP排行榜也許不再是天方夜譚。技術革新既是挑戰(zhàn),也是機會??萍嫉倪M步促使人類在探索更多可能性的同時,也重新審視自己的價值。
(以上圖源皆來自網(wǎng)絡)
參考資料:
1. 周莉,鄧陽《人工智能算法作曲發(fā)展的現(xiàn)狀和趨勢研究》,《藝術探索》,2018年9月
2. 毛康,林勇《人工智能作曲發(fā)展的現(xiàn)狀探討》,《山西青年》,2019年7月
3. 機器之心《不會音樂也能作曲?AI開啟智能音樂創(chuàng)作》
4. 任夢巖《當AI開始作曲 還有啥不可能的?》
5. 中國新聞社《科班畢業(yè),兩分鐘寫首歌......AI歌手來了,人類還能做什么?》
6. 范正輝《在AI面前,Rapper要率先失業(yè)了?》
7. 木槿淺藏心《人工智能與音樂創(chuàng)作》
此內容為【智能相對論】原創(chuàng),
僅代表個人觀點,未經(jīng)授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網(wǎng)絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
智能相對論(微信ID:aixdlun):
AI產(chǎn)業(yè)新媒體;
今日頭條青云計劃獲獎者TOP10;
澎湃新聞科技榜單月度top5;
文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
著有《人工智能 十萬個為什么》
【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。