2022-08-25・產業

「我輸入北流的建築風格,但AI聽不懂」——落日飛車的演唱會海報,是如何用Midjourney製成的?

還記得今年 6 月時,有一位 Google 工程師因為認為公司開發的 AI 聊天機器人「LaMDA」有「靈魂」,並且對外洩漏對話機密而被革職。去年又有 Robot Swing 和陳以恆、洪佩瑜合作一首〈AI敢會愛〉出道,讓我每次聽到 AI 就會唱起這首歌(至於王力宏在五年前的〈A.I.愛〉我們就先別提了)。這項科技顯學,如今又有獨立音樂人更直接地近用於演唱會海報製作上了(終於不是 AI 作曲或炒爛的 NFT)

落日飛車即將在 11 月 26 日首度唱進台北流行音樂中心,舉辦落日飛車【夕陽流行音樂中心】演唱會。這場演出不僅預告由王希文擔任音樂總監、完整弦樂四重奏及合音編制,演唱會海報還特別以 AI 算圖工具 Midjourney 製成。

他們在新聞發稿中分享:「因應『夕陽流行音樂中心』這個演唱會主題,我們在發想視覺時就想到時下最流行的 AI 技術,這個軟體輸入關鍵字就可以自動生成不同的設計,有點像現在許多人聽流行音樂的習慣都是由串流軟體的演算法推薦,生成出來的圖也很符合落日飛車想要的演唱會意象,簡直太完美了!」

Midjourney 於今年 5 月推出 beta 版後迅速走紅。該 AI 建立於 Discord 的伺服器上,使用者只需輸入指令與關鍵字,即可生成相關的 4 款圖片,並選擇下載或者持續優化。其「簡單粗暴」(使用門檻低、出圖迅速)的特性,讓他的應用性變得極廣,在直接的商業利用外,也可以作為設計師與客戶間,初期提案、對焦概念的參考。

然而用 AI 製作演唱會海報,真的比較容易嗎?

細看落日飛車這次的演唱會海報,融入夕陽、山脈、雲海、光點等符號,並帶有 80 年代的科幻風格,幾經詢問得知此張海報原圖,是夕陽音樂廠牌工作人員,偶然看到長期友好的影像工作者林毛(執導過飛車的〈Vanilla Villa〉、9m88 與王若琳的〈Material Girl〉、美秀集團的〈馬克吐溫〉等 MV),某陣子一直在玩 Midjourney 後的突發奇想。事前他們也曾找畫家合作,後來想想或許 AI 也可能交出他們想要的作品。

在海報釋出之後,我透過夕陽音樂廠牌夥伴,與林毛進行了一次線上訪問,不僅試圖了解這次的 Midjourney 製圖歷程,也好奇她如何看待 AI 製圖的發展。林毛在臉書上寫到,為了這次製圖她花 50 美金的月費購買 Midjourney 企業版,以開啟私人模式及商用權利;不同於一般使用者單單使用關鍵字來生產圖片,林毛花更多時間在處理的是「以圖養圖」,透過一代又一代的「圖片繁殖」,直到最後「接生」出落日飛車想要的畫面,最後再由夕陽音樂的工作人員進行後製調色、排版。

有趣的是,林毛在臉書文末曾用「突破人類設限的恐怖」來描述 Midjourney 的屬性,這段訪問最後也超展開,進入關於 AI 與人性的哲學思辯(似乎目前關於 AI 的討論,都很容易昇華到此境界,好似在閱讀一本科幻小說)。她以擬人的方式形容 AI 像是一個「安靜的組員」,要付出相處溝通的時間成本,而過程中許多「人為的選擇」也沒有少。以下是我與林毛的訪問對話:

Q:想先問林毛,從什麼時候開始玩 Midjourney?以影像創作者的角度來看,妳覺得他吸引人的地方在哪?

一開始台灣 MJ 的臉書社團創建的那幾天我就加入。從社會性的角度來看,他非常吸引我的第一點就是資訊、技術的解放(這點最重要),當然還有簡易操作的模式,訂閱會員價格也便宜。從影像創作者角度,我覺得他跟在 Steam 上購買的小遊戲一樣讓人沉迷探索,像開放地圖的小遊戲,我們彷彿能無窮探索可能性。

Q:妳在臉書貼文上說,自己用 Midjourney 的 beta 版亂做了一個影片,這個影片也是開啟落日飛車找妳用 AI 製作海報的契機,請問是什麼樣的影片呢?

Q:在用 Midjourney 製作海報主視覺時,妳第一組輸入的關鍵字是什麼?為什麼是設定這組關鍵字?

應該是很直白的「a black star shape spaceship on sunset sea, a roller coaster in far」(在日落餘暉的海上有一台黑色星艦,遠處則有一台雲霄飛車),最後配上「80 sci-fi magazine cover style」(80 年代科幻雜誌封面)——星形狀的太空船,是想要出現個什麼來接近北流的建築。其實測試國國給的關鍵字(想要出現的幾樣物品)中,最困擾的就是北流。我輸入北流建築風格,還有北流的名稱等等時,AI 就是怎樣都聽不懂,所以這張圖的開端才改成這樣。

我會認為這是第一組是因為,我並非在輸入關鍵字後就直接得出圖片,而是我從他誕生的圖片,再做成新的關鍵字,也就是「圖片本身是關鍵字」。這算是一種應用技,你可以先在 Discord 上取得圖的連結,並加上想要的長寬比(如圖所示),該連結就會成為你新的關鍵字。

就如同我自己的臉書文章所說,「圖片生圖片」就像繁衍一樣,事實上我們這張的「媽媽」是蛋黃那張(見第二張圖片的上半部),那張我們也很喜歡。

Q:妳挑選每一輪的新圖標準為何?後續又輸入了哪些新的關鍵字來「優化」圖片?

從跟夕陽音樂的討論中,我理解他們想要 minimal(極簡)的感覺,而我有刻意不加這個關鍵字,而是人為的一起來選擇裡面偏 minimal 的下去發展。

我採用圖片做為關鍵字這個手法,讓圖片生圖片,所以其實後來沒有增設關鍵字,後來的關鍵字都只是比例或解析度。

Q:除了輸入關鍵字、母代圖片讓 AI 持續演算外,妳在設計上還做了哪些「人為的」控制作業?

人類能做的就是選擇。我個人覺得,控制作業最強大的還是「夕陽音樂廠牌」,他們要判斷圖片適不適合他們使用。我自己本來做了一張我很喜歡的圖,但也許跟他們的風格真的差太多。

Q:可以跟我們分享幾組,過程中曾經繁殖出來的圖片與它的誕生指令嗎?

我可以分享一張,我自己喜歡但並非他們當初所需求的風格的一張。這是誕生在中間的產物。

這算是草稿,字體是先隨意寫上的,既然被淘汰了,我應該還是會用來當自己生活照的剪貼背景。

Q:有哪幾組沒用上的原型圖片,是你自己特別喜歡的?

如上提所述。我好像回答反了問題。總之,有幾張與後來風格類似,但最後投票中落敗的。

Q:從輸入第一組關鍵字,到演化、挑選出最後一張圖,整個「設計旅程」花了多少時間?

絕對比想像中多,人類的溝通程序是很繁瑣的!

Q:妳覺得最後的畫面成果,跟妳過去的「影像風格」是否相近?或者已經被 AI 超展開了?

我一直都覺得他像是我新結交的靈魂好友,一個能將腦內圖樣具現化,有時候比真實的人更懂自己要什麼的工具。像是與人聊天過程,一起講出同一句話。

如前幾個提問,我有用 AI 圖片們剪了一個影片,個人覺得他在我的風格裡面發揮的很好。我作為影像導演,也會跟各組組長、組員溝通需要的東西,並必須清楚指出他們給的回饋是否是我要的,然後承擔這個回饋的成果。而他就像一個安靜工作的組員。

我不會特別去想相不相近或是超展開,反而覺得他像是自我的衍生(但前提是我花夠多時間跟他相處 XDDD,我感覺熟悉彼此的過程像結交伴侶似的),同時也是自我批判的理據。

工具在文明中誕生,文明又誕生在工具中。一個將 A 至 B 的過程簡化的手段,就是促進生活,讓人有比較多時間開心,以及處理思想、文化、政治上的問題。當然有時候生活會被工具牽制、魔改,反過來形塑人的心靈,而這就是 STS 研究在探索的問題,我相信未來會有很多人以此為論文。

與其去擔心是否被超展開,我反而特別推崇,「先前被設定有門檻的技術類型的事物,得到科技的補助進而解放至全民手中」這件事。例如智慧型手機上的各種 APP 誕生後,全民就能進行影片剪輯創作、一隻手就能完成,所以才有這麼多好看的迷因影片。至於全民拍片有沒有讓嚴肅文學、藝術電影變得更差,這是很多人喜歡引戰的問題,那某一程度也強化人類去思考,至今的器物演變與心靈處境。

把此題想更大的話,可以假設發電這件事若技術解放、下放至每個人都能做,而且輕鬆無汙染(真的用愛發電的話啦),那能源問題也就解決,人類可以往下一個階段前進,或是往下一個階段毀滅。當然,這不是批判或倡導嚴肅跟細緻的專業技術,應該解放成「無腦使用化」,反而是在說,我們的世界正因為有足夠能力將之變為常識基礎,才可以去思考下一步還能怎麼走。

Q:在臉書貼文中,妳屢屢用「恐怖」來形容和 AI 合作的旅程,不論是祂或你自己的恐怖偏好。可否再多說明一點,那個「恐怖」究竟是什麼?

因為 AI 對於人性,我認為是陌生的,也有人批評他根本不知道自己在畫什麼,只是把應該放在一起的東西亂拼在一起。我不會去評價這個批評,他確實有其道理且情緒化(人性的表現)。但對我而言重要的是,我想理解出,為何我想算出恐怖或不安的圖案,往往輕易得到超群的成果?

我認為他在處理「恐怖」時比人類強,所以我認定那是因為我們的心智有社會性的訓練,對即將無法承受到某個程度的不安的視覺影像會有停損點,但 AI 沒有接受過社會義理、忍耐與底線的教育,他很輕易可以衝破我們快要無法接受的那個藩籬——無法名狀的陌生會帶來恐怖,不然就是笑點——這也是這軟體出來後,大量圖片出現在肉體恐怖為主的社團中,但對於和諧之美那類的,他總是算出很歪的圖,要調整很久很久,也是同理。我看社團的大家蠻密切在討論,如何將畫面的異質感調整出和諧舒服。

我室友則有另外一個看法,他覺得他畫的東西還是有一個「一看就知道是 AI」的特質,有那個氣味。他覺得反而是 AI 將自我藏在一個可以被辨識的風格中(在我眼裡則是,不理解文化詞彙真正意義產生的,正面意義的畸形),他覺得靠風格再跟大家說「其實我在喔」。

Q:透過 AI 來設計海報,有比較節省「設計成本」嗎?對於有人擔心 AI 將取代設計師這題,你怎麼看?

我不是設計師(偶爾幫忙設計)所以這個問題有點為難。但我之前在幫朋友用 MJ 出的海報圖上手寫字時,就看到很多人用 MJ 出海報感的圖,然後文字都是模仿文字,但全部寫錯的狀態,這就給我靈感:我要寫一個每個字都微錯字的海報。

我觀察到的是,已經有許多設計師用 AI 無章法、沒有這麼有道理地,將概念生成圖樣的方式,在給予自己靈感與刺激,進而更有效率、更集中能量創造。我想真的是工具在手、看個人用。至於取代與否的問題,端看這社會對設計的需求與要求究竟是長什麼樣子,而需求的模樣則取決於態度,還有對其帶來效果的期望。

Q:和 AI 合作設計,跟傳統的做法有什麼異同之處?

溝通成本都很大。

Q:如果也有其他音樂人想用 Midjourney 做海報甚至專輯封面,有建議大家在作業上注意哪些步驟嗎?

我潛水在社團發現,大家用的關鍵字常常很雷同,覺得可以多探險。然後可以買 50 鎂以上的方案,因為這樣才有私人模式。這次用 MJ 做海報,不管是夕陽音樂還是我,一開始應該是一種好玩的心態,做這張海報應該有兩個月前了,當時因為身邊眾人都還在震驚他的便利、簡單跟神奇,所以那時候有種心態是,既然這樣就真的用來做嚴肅的產出看看,略帶著一種 troll(惡搞)的心態。

至今心態有點不同了,不管怎樣,應該盡情使用,作為對視覺想像能否溢出常理的渴望與補助,不要被他限制。調教他!抵抗他對你的調教!即便不能也不用失落,他滲入我們成為開拓想像力的藥劑,我們理應視為新的日常並保持對話。雖然我們出那張海報的那個原點很單純,現在講這些很後話,但這是我這幾個月來的心得。