這是我在ChatGPT上使用DALL-E3大概一個星期的心得。
這裡先說明一下自己的狀況,在此之前,AI繪圖我就只有簡單玩過midjourney。但因為英文介面,加上下指令的方式對我來說也不直觀,所以在midjourney只玩了幾張就不玩了。
此外,我也沒有參考多少別人的教學,所以我摸索出來的下指令方式,很可能也不是最有效率的。
但在ChatGPT上我就玩得很開心,因為可以直接使用自然語言描述指令,又可以用中文,它的翻譯功能會將我的指令轉成英文來下。所以對我來講真是又直覺又不費力,可以進行大量的測試。
此外它的生成結果也很穩定,只要指令設定的細節夠多,我不斷地請它重新生成,即便出來的結果肯定在一些細節上不同,但大致上會在一個範圍內,穩定到超乎我的預期。
只要你有能力具體精準地描述,就有辦法操作得更精準,當然這不是真的100%呈現,畢竟就算你用純語言敘述想像的畫面給資深畫家或設計師,他畫出來的內容肯定也是跟你腦海中的畫面有差距,但「核心概念和重要元素有到」就好,加上可以不斷地嘗試修正到自己滿意,真正的設計師可沒辦法讓你這樣要求。
我知道就算使用者只給ChatGPT幾個單字,或是一兩句簡短描述,DALL-E3也可以繪製出一些很不錯的作品,但這種作品很可能和自己原本的想法有很大的差距。
整體來說,只要能寫出更多具體細節,就有機會更精準地呈現更多自己想要的內容。
有些圖片的指令我甚至寫到大約500字的內容,也成功讓DALL-E3繪製出大多敘述內容。
只要指令寫得出來,描述一套穿搭時,像是服裝的版型細節,衣料材質都可以設定,配件也都可以設定。
只要指令寫得出來,描述一個房間時,不只顏色,裝潢的材質,裡面的擺設物,擺設物的種類都可以設定。
好比說你要在房間設置花盆,還可以進一步指定是什麼花。
這裡就以一個實驗範例來看看我一步一步追加指令的設定如何被反映出來。
首先我下一個指令「請為我繪製一間白色的房間,裏頭空無一物」其中一張結果如下:

接著我添加指令:「請為我繪製一間白色的房間,裏頭有一張桌子,和兩張椅子」,其中一張結果如下:

接著我繼續添加指令細節「請為我繪製一間白色的房間,裡頭有一張桌子和兩張椅子,房間週圍有一些盆栽,盆栽種植的是各色的鬱金香」,得到結果不僅有盆栽,而且也真的是鬱金香:

最後我再添加敘述:「請為我繪製一間褐色基底的房間,地板是光滑木質,裏頭有一張桌子和兩張椅子,房間週圍有一些盆栽,盆栽種植的是各色的鬱金香。房間有一扇落地窗,窗外是山景」:

也就是說,只要你擅長描述畫面,DALL-E3還真的可以實現不少你想像的內容。
但這就會有一個問題是,你必須要有能力「具體精準地描述內容」,這是什麼意思呢?假設給你一張照片,你有辦法描述照片中多少細節?或者更進階的問題,假設你腦海裡有一個關於畫面的想法,你的想法有多具體?你有辦法用具體的語言描述你腦海裡的畫面嗎?
也就是說,我認為要更精準地讓DALL-E3畫出自己想要的內容,核心能力在於「圖轉文」,你總要有辦法將想要的畫面以具體的語言描述出來。
這裡打個比方,假設當你腦海裡出現一個正妹的想像,如果直接對ChatGPT下指令說「請為我繪製一名正妹」,我相信有超過99%的機率出來的和你的喜好差距極大,你要有辦法具體描繪出他的臉蛋、髮型、穿搭、姿態等,才能更接近你想像中的畫面。
反過來說,有時候我們在看小說時,會說有些作者的描述「很有畫面」,指的就是類似這個意思。
這篇就先談到這邊。