前面談完如何繪製角色,也談過如何設計場景,那麼這次來談如何設計人帶景的畫面吧。

我同樣是以「圖轉文,文轉圖」的方式設計,但和單獨設計人或景不一樣,在繪製人帶景的主題時,我是將人和景分開來設計,然後結合在一起。

不過還要加入另一個要素,就是人和景的關係,人在景中的位置,是什麼姿態。

以下是範例,這個範例的場景設定和人物設定,我是分別各用一張圖給ChatGPT進行「圖轉文」,於是會生成兩個個別獨立的指令,我再將兩者直接貼上。

先上指令圖,上半部黃色框框部分的是場景指令,下半部藍色框框的則是人物指令

出來其中一張滿意的成果如下,場景和女子大致都有反映指令的設定(雖然沒有站在月台上,而是站在月台旁):

接著是將站姿改為坐在月台上

這張的髮型設定有跑掉,但整體上我挺喜歡的,就作為範例。這裡特別強調一下,用DALL-E3並沒有辦法每次都完全如自己指令設定呈現,有時甚至可能會出現落差很大的狀況,不過精準具體的設定還是可以大幅提高畫面反映自己想法的機率。

最後再上一張改成坐在月台椅子上的圖:

如何呢?

原理上來說就是這樣,但是實際上有不少細節需要進一步探究,特別是在我使用到目前為止的經驗,人帶景的圖在表現上要如實呈現自己腦海中的概念,似乎有更多複雜的變數要考慮,這篇我就先大概提幾個狀況。

像是人和景必須要某種程度上能自然地融合,而不會有多餘的場景衝突(不過設定衝突場景有時是必須的,好比說要創造奇幻超現實淚的畫面,這之後另外談。)

舉個例子吧,我曾經設定一位穿著西式婚紗的角色,放進西式的房間設定,就可以如設定呈現角色的穿搭設定,但同樣西式婚紗,放進傳統日式的場景設裡面,生成的圖大多都不會將角色的穿搭呈現出來,甚至可以說是完全跑掉,沒有一點我設定的內容。

在我看來,雖然我的指令撰寫方式,是將人和景分別設定,但DALL-E3卻不會獨立開來看待這兩個設定,而是當成一個整體,於是出現這種西式婚紗的角色搭配傳統日式場景時,因為在常理來說不太會出現,所以DALL-E就硬生生將我的人物設定整個改成適合場景的圖片。

以這點繼續延伸下去,我發現人的設定和景的設定會互相影響,好比說人的國籍設定會影響景的文化風格,反之亦然。

具體來講就是,我如果將人物設定為台灣人,那麼即便在場景沒特別強調地點在台灣,場景也很容易繪製成一種「傳統東方味」(基本上是歐美人士對東方的刻板印象,而非真正台灣)。相反的,我如果將場景設定在台灣,那麼我的角色也常常會自動被繪製成傳統東方式的外型和穿搭風格。

此外我發現,下指令時,細節多寡也會影響構圖,好比說,如果人的細節描述特別多,甚至連五官都描述得很仔細時,就有比較高機率會出現人臉就佔畫面很大位置,景反而被減少比例,反之,如果景描述得很細,人描述得很少,人在景中可能會佔很小比例。

這個部分,我到目前為止的合理解釋是,你大概要能夠去想像一下文字中的畫面感,好比說如果你能仔細描述一個人的五官特徵,那想必他應該是在離你很近的位置,反之,如果你只能粗略描述的話,他可能就在比較遠的地方。

如果你要忠實呈現自己的設定的話,人帶景是一個理論上很單純,真正操作上很多細節要去調整的主題,這個之後我再慢慢分享。

最後修改日期: 2023 年 11 月 3 日

作者