2024-05-31・產業

青鳥行動之後,我們訪問了用AI作出City Pop〈蔥師表〉的詠唱師:「我不覺得我得了幾千個讚就是個音樂人。」

當音樂產業專家、學者,仍在為 AI 音樂的應用與倫理問題煩惱,台灣網友已經透過 AI 音樂生成工具投入一場運動,且玩得不亦樂乎。

「道德的長城,政治的完人⋯⋯」在 2024 年 5 月掀起的「青鳥行動」中,與具現象級討論度的音樂話題之一,便是〈蔥師表〉的 AI 音樂大亂鬥了。本來只是民間迷因團隊釋出的仿古諷刺詩作,意外地二創作品不斷,從簡單的朗誦,到後來更有網友自發性透過 Suno AI 生成,並在 Threads 上流傳四竄,一發不可收拾。

觀察 AI〈蔥師表〉的風格類型從 K-pop、J-Rock、重金屬、龐克、trap、psy trance 到華流抒情都有,語言也橫跨中文、英文、日文、韓文、台語、排灣族語等。曾被紀錄下來的版本超過一百種,且仍在持續增生。

閃靈 Freddy 日前也立委吳沛憶的 Podcast 直播上用死腔表演〈蔥師表〉

29 日晚上,我透過線上聯繫訪問了用 Suno AI 生成 city pop〈蔥師表〉的創作者柏動。除了 city pop(嚴格說來可能比較像九〇年代初的 J-pop),他也製作了 bossa nova 與另類搖滾(90s alternative rock)版,後者在 Threads 上面獲得兩千多次轉發,儼然是這波最受矚目的作品。

在一片品質參差的〈蔥師表〉音樂中,這三首歌也的確是少數我認為比較「好聽的」。雖然聲音的 AI 塑膠感仍重,但旋律性還不賴(歌詞改成日文或英文,或許也創造了一點距離美感),幾乎可以給真實的樂團參考,直接進錄音室「翻唱」了。

現正就讀外文系碩士班的柏動,並不具有音樂製作能力(他自認唯二會的樂器是六孔陶笛和 KTV 包廂裡的鈴鼓),高中時曾在校園電台當 DJ,如今則在爵士音樂餐廳實習,才稍稍累積一點樂理常識。

柏動過去並沒接觸過 AI 音樂工具,起初是先做了〈蔥師表〉英文朗讀版(運用另一款 AI 工具),後來想說英文版都做出來,乾脆繼續做成一首歌吧。他說:「老實說在我做第一首〈蔥師表〉AI 音樂的時候(我記得是在上週日 5/26 的凌晨 5 點多),AI 音樂還沒在 Threads 上流行起來,後來變得如此熱門我自己也嚇到!」

歌曲廣傳後,他旋即發布了一份「科技倫理公告」,講明生成的動機、過程並分享每首歌的 prompt(用於生成的指令)。他在該公告中打了「預防針」,表明這些歌曲本是「為了網路娛樂效果,且無意追求藝術表現」,自己也在藝文產業實習,對於 AI 的影響有所了解,因此他沒有把歌曲放上串流平台的打算,YouTube 頻道的盈利亦已關掉。他解釋:「因為我覺得這樣對認真創作的音樂人不公平。而且,如前所說,這幾首不過是娛樂用的速食製品,我也不覺得我得了幾千個讚就是個音樂人還是製作人。」

呼應不同音樂類型的〈蔥師表〉封面,左起為:另類搖滾、city pop、bossa nova 慢搖版。(封面提供:柏動)

〈蔥師表〉的 AI 音樂並不總是受人喜愛,也有音樂人表明這類歌曲難聽且氾濫。然而它沒有「原創者」的特殊性質,正呼應著 Threads 的傳播特性,以及「青鳥行動」不同於「318 學運」的時代生成背景(詳見黃哲斌老師的觀察側記)。聽聽柏動的分享,或許能更了解這次〈蔥師表〉AI 音樂大亂鬥中,為何集中近用於 Suno(它的便利性與門檻有多低?)以及更重要的,「人」在其中的作用。

以下為我和柏動的線上 Q&A 完整記錄:

Q:可否簡單的自我介紹一下,該怎麼稱呼你?目前的工作或學歷背景為何?

《吹音樂》的阿哼主編與讀者們大家好,我是柏動。現在就讀臺北一間大學的外文系碩士班,興趣與研究領域為莎翁戲劇、性別研究和後殖民研究。平常除了唸書做研究外,也在爵士音樂餐廳實習,參與公司的社群經營、活動行銷、圖文製作等工作。我喜歡文學、音樂、跳舞,也喜歡在網路上搞笑。

Q:你是透過什麼管道發現「蔥師表」的?觀察大家為什麼會對「蔥師表」那麼有反應?

一開始是在 Threads 平台上看到文字版〈蔥師表〉,覺得網友的創意實在是太有趣了。我覺得正是因為臺灣的網路世界資訊傳遞快速,而且發言自由,網友對政治與時事的針砭常常能以搞笑的形式流傳。除了是一種苦中作樂外,也讓所有人都可以共同參與創作,像是〈蔥師表〉就是由許多網友提供意見,慢慢加長、改編,才演變成現在最廣為流傳的版本。

Q:你平常就是音樂創作人嗎?是什麼原因觸發你使用 AI 生成「蔥師表」音樂?

我並不是音樂創作人,我唯二會演奏的樂器是六孔陶笛和 KTV 包廂裡的鈴鼓。不對,現在想想,我 8 歲的時候其實上過一個小時的鋼琴課,然後就哭著回家跟媽媽說我不要學了。我離音樂最近的時候,應該是高中時擔任學校的校園電台 DJ,在午休時段分享流行音樂新聞和放音樂給同學聽。現在則是因為在爵士音樂餐廳實習,才慢慢累積了一些基本樂理常識和對樂團編制、音樂製作的理解吧。

在生成 AI 音樂前,我其實是先製作英文文字版的。當初在網路上看到文字版〈蔥師表〉,我就也想用我的專長參與〈蔥師表〉的創作行列。想來想去我最擅長的應該就是英文了,所以我是先發布了〈蔥師表〉英文文字版與英文朗讀版。英文朗讀版因為想特別復刻英國古典戲劇的表演方式,音源也是由 AI 生成,是用 Deepgram 這個 AI 工具做的。

英文朗讀版發布後,我想說英文版都寫了,不用也可惜。所以我就把主意打到音樂上了。老實說在我做第一首〈蔥師表〉AI 音樂的時候(我記得是在上週日 5/26 的凌晨 5 點多),AI 音樂還沒在 Threads 上流行起來,後來變得如此熱門我自己也嚇到!

Q:為什麼這一波普遍都是使用 Suno 來生成?它有哪些特性可以吸引這麼多人使用?

Suno 是現今網路上完程度最高的音樂生成式 AI,UI 簡潔好操作,而且生成用的指令可以到很精準。免費版帳戶每天有 50 個點數可以拿來生成音樂,而每生成一次 120 秒的音樂會花費 10 點、生成 2 個版本(這裡沒有業配!)。而且生成出來音樂還可以自動匯出歌詞影片,轉發到各著社群平台,都能有很好的收看體驗和曝光效果。加上現在許多網友的創意和作品在網路上流傳,更反過來為 Suno 帶來曝光和宣傳。我猜 Suno 官方一定覺得很瞎,怎麼這週突然暴增許多 IP 在臺灣的使用者,還生成一堆跟什麼蔥有關的歌 XD!

Q:你平常就有在使用 AI 生成音樂嗎?還有哪些常用的 AI 工具?

平常沒有耶,這是我第一次使用 AI 生成音樂。我平常會使用 ChatGPT 協助審校和編輯文案,然後因為現在在學校上生成式 AI 的課,還有使用聯發科的「DaVinci(達哥)生成式 AI 平台」和 Google 的 Colab(一個能用 Python 跑 AI 的平台,我們正在學怎麼用 Colab 跑/訓練文字生成式 AI 的語言模組)。

Q:你私下喜歡聽的音樂有哪些?請分享最近在串流平台上聽的三首歌。

我聽的音樂很多耶!從爵士、八、九〇年代搖滾樂到現代西洋流行樂、K-pop、J-pop 都有。只能選三首歌實在太痛苦啦!但硬要選的話,應該是 Taylor Swift 的〈Florida!!! (feat. Florence + The Machine)〉、Olivia Newton-John 的〈Please Mr. Please〉和 Carly Rae Jepsen 的〈Kollage〉

Q:你為什麼選擇生成 bossa nova、city pop、九〇年代另類搖滾風格?

我選這三個風格其實是有很認真的動機的。第一個選 bossa nova 是因為那是我最喜歡的 Jazz subgenre,而且同時又是五〇年代巴西的文化新浪潮產物。巴西文化新浪潮年代的 bossa nova 融合爵士、森巴和咻樂(choro),曲風和歌詞描述悠閒的海灘、熱帶風情、天空好藍啊等等。但是直到六〇年代,巴西的建設失敗導致經濟蕭條,音樂家們也開始把抗議的聲音融入 bossa nova。

簡單來說,我覺得 bossa nova 是一個對社會抗議的象徵,以很 laid-back、很從容的音樂呈現,拿來做〈蔥師表〉音樂的話,可以從歌詞的諷刺與曲風強烈對比呈現出人民的不滿。還有另一個比較不重要的考量是當時是凌晨 5 點多,算一算做完發表的時間應該是早晨吧,我內心的行銷魂說拿 bossa nova 跟大家說早安非常適合哈哈。

發行完 bossa nova 的當天晚上我就開始做 city pop 版。city pop 也是我大學時期非常喜歡的曲風,對當代人來說除了有八、九〇年代日本的復古情懷、都市繁榮、電子科技、外國文化、未來主義等等美好想像,更有在繁華時代的投機心理下,埋伏經濟泡沫化與大蕭條的不祥烏雲。

2000 年出生的我很幸運沒有經歷過經濟大蕭條,可以很方便地欣賞 city pop 的美好遺產,但不代表這些經典歌曲後隨之而來的苦痛(尤其對現在五、六十歲的東亞人),是可以輕易忽視的。放在這個前後文下,在當代復興 city pop 的意義便很明顯了。我也要感謝我的好朋友凱吉在得知我想做 city pop 的當下熱情提供〈蔥師表〉日文翻譯,還幫我把片假名發音都標示出來,才讓 Suno 生成出發音正確的版本。

最後的九〇另搖是我私心最喜歡也最期待的版本。發布時間是週一晚上,也是青島東集合的前一天晚上。如我在 Threads 上所說:「90 年代是搖滾的年代。英國正流行起另類搖滾,打開電台總會聽到 Oasis、Guns and Roses 的激昂搖滾。90 年代也是反動的年代,臺灣的野百合學運,跨出民主的一大步⋯⋯大家今晚好好休息,讓這首〈蔥師表 九零另類搖滾版〉給你補足能量,明天再見。」

這三首歌雖然看似彼此無關,但其實都回應了我希望音樂帶給大家的意義:年代造就經典,而時代賦予經典更多意義。

Q:這三種曲風類型裡,哪種風格最難設定指令呢?

生成方面,這三個版本中 bossa nova 最簡單,我記得生成 8~10 次就有我很滿意的版本,而 city pop 和九〇另類搖滾其實都滿難設定的,因為 Suno 很容易把 city pop 跟 J-pop 搞混,很多成果都太現代、太快樂,我前後調整 prompt 20 幾次,其中關鍵字除了city pop 還要定義 funk、使用樂器薩克斯風等等,生成了快 30 個版本吧才有滿意的,還要剪接成果。

九〇另類搖滾也有類似的困難,可能 Suno 對音樂年代的瞭解沒有那麼清楚,所以就要用其他定義方式讓它了解我的意思。另外,九〇另類搖滾的歌詞花最多時間,因為為了押韻,很多內容大幅改寫過。

Q:有些人覺得「蔥師表」音樂風潮好玩,但也有人覺得「蔥師表」音樂普遍「難聽」。你會如何回應那些覺得「難聽」的人?

老實說我要懺悔,我個人沒有聽很多其他創作者做的 AI 音樂。因為反黑箱運動的同時,我身為學生也被許多報告死線追殺著 XD。但是生成式 AI 的確本身就附帶許多爭議,不管是現今法條還是大眾觀感都很難有共識。我認為這次〈蔥師表〉風潮讓大家對「音樂製作」有了新的想像,也挑戰音樂界很多現有框架。尤其是對音樂製作的可取得性已經擴大到幾乎所有人,所以未來也有機會看到更多由 AI 輔助或製作的音樂出現。

我對此是保持樂觀態度,因為我相信音樂始終出自於人的生活經驗、情感累積和思想,而 AI 只是工具。創作音樂變簡單了,但創作「好」音樂並沒有。我也相信聽眾有能力和權力去自己決定什麼是「好」音樂,什麼是「跟潮流」的搞笑歌。這兩者的目的和運作場域都不同,是需要好好區分的。(延伸閱讀:柏動的科技倫理公告

至於覺得〈蔥師表〉音樂普遍難聽的人,我一樣再引用一次我自己的貼文:「這些歌由 AI 作曲,只為網路娛樂,無藝術價值。愛音樂請多多支持真人音樂創作者!」

Q:在生成「蔥師表」音樂時,你會試著讓它變得好聽,還是比較期待它能完整模仿特定曲風?

當然是兩者都要兼顧囉!我可是為此還花錢儲值了進階方案呢。

Q:最後請和我們分享一下,你用 Suno AI 製作「蔥師表」音樂的 prompt。

  • Bossa nova 版:Bossa nova infused with modern pop, jazz female singer. Use a trumpet, drums, a bass, and piano. 170 bpm.

  • City pop 版:1980 style funky Japanese City Pop, mature female singer in sad voice. Use a piano, synthesizer, drums, an electric guitar and a saxophone. 200 bpm.

  • 90 年代另類搖滾版:90s English alternative rock band. Sad and angry composition. Male lead vocal singing in high-range Baritone. 175 bpm. Use a tambourine, guitar, drums, keyboard, and bass.

值得注意的是,除了 prompt 外,在輸入歌詞時,也要在歌詞文字中加入每個段落的名稱和演唱指示,例如 [Verse]、[Pre-chorus]、[Chorus]、[Bridge]、[Out-tro, spoken] 和 [rap]、[piano solo]、[saxophone solo] 等,才會有類似現在較主流歌曲結構效果。

最後,Suno AI 並沒有完全按照我的 prompt 的 bpm 生成,三個版本我最後挑出來最好的成果分別是 136 bpm、138 bpm、76 bpm。除了 half time/double time 的差別外,可能 AI 也有參考各個曲風比較常用的歌曲 bpm 再加以調整。

最後謝謝《吹音樂》的採訪,也謝謝阿哼給我發表我的創作動機與分享想法的機會。



avatar

作者 / 阿哼