跳到主要內容區塊
Logo圖片

MENU

返回

設計工具 2023.06.15

圖像生成工具

2023.06.15

AIGC是一種基於人工智能技術生成內容的方法,作為當代的熱門詞彙,它在圖像生成領域有廣泛的應用並大幅降低了數位繪畫創作的門檻。圖像生成是指通過計算機算法和模型結合後台所提供的數據集,便能以運算生成一個作品。若結合自然語言分析(Natural language processing, NLP)使用者便只需要通過輸入文字描述,計算機便可以識別並翻譯成演算法可以理解的資訊,達到以文字產生圖片(Text-2-Img)的效果。

而圖像生成工具隨著技術熱度提升已經百花齊放,以下我們將介紹幾項比較熱門的圖像生成工具:
 

1. Midjourney

以Midjourney輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像

以Midjourney輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像(圖片來源:Midjourney)
Midjourney官方連結
收費:10~60美金/月不等
 

Midjourney 於2022年7月12日進入公開測試階段,成為當時世界上社群成長最快的圖像生成工具。相較起當時的其他生成工具,Midjourney其特色是搭載在免費即時通訊軟體Discord上,以機器人指令的方式提供服務。使用者只需要輸入想像中圖片的描述在聊天視窗內作為關鍵字(prompt)或提供原始圖片,就可以透過伺服器的AI運算產出相對應的圖片,並且可以對圖片進行提升細節(Upscale)或是產生變體(Variations)的操作,整體使用起來非常便利與直覺。
 

同時,Midjourney也提供了高強度的社群功能,在其官方頻道的社群展示中可以看到其他人生成的圖片與使用的關鍵字,使用者可以搜尋自己想要產出的風格或內容作為參考研究。而由於使用人數規模龐大,網路上也有許多輔助工具來協助使用者生成更精確的關鍵字,例如:midjourney prompt helper 等。然而Midjourney目前已不提供免費試用的服務,而收費標準從基礎的10美金每月到企業級的60美金每月,可以針對需要的使用情境進行挑選。

 

2. Stable Diffusion

以Stable Diffusion輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像

以Stable Diffusion輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像 
(圖片來源:Stable Diffusion)
Stable Diffusion 官方連結
售價:免費


Stable Diffusion 是一個2022年8月29號公開模型的開源圖像生成工具,使用者需要下載至自己的電腦內或是利用CPU虛擬機如 Google colab 進行運算。Stable Diffusion 的優勢在於其生成圖片的穩定性,即使在使用不同的隨機種子進行生成時,也能生成出穩定且高品質的圖片。

Stable Diffusion 的免費性與開源性是使用者對其愛不釋手的原因之一,只要複製 Stable Diffusion 原始碼,按照喜歡的方式研究與訓練,便能定製化處理需要的文字生成圖片任務,甚至開發獨立應用或服務。同時,你也可以藉由下載其他人已經訓練好的LoRA模型或ControlNet,可以更快的生成目標圖片。然而相較於其他圖片生成工具,Stable Diffusion 的需要調整的參數更加複雜,介面對於初學者不友善,需要一定的程式基礎才能進行使用。若是初學者可以考慮採用相同引擎的Dreamstudio使用,但相對來說介面就會相對簡陋。

 

3. Bing Image creator

以Bing Image creator輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像

以Bing Image creator輸入「WeWe Futures: 2040 Diversity & Inclusion」所得出之圖像 
(圖片來源:Bing creator)
Bing creator官方網站
售價:每天免費額度,可換取點數
 

Bing creator是Microsoft於2023年3月21號宣布對其搜尋引擎Bing升級的服務。使用者只需要利用微軟帳號登入網頁,就可以免費使用Bing creator影像生成工具,而合作技術來源是知名的人工智慧公司OpenAI所開發的Dall-e模型。Bing creator為使用者提供了一個類似搜尋引擎的簡易介面,讓使用者能夠快速地進行圖像生成,並且能夠輕鬆地將生成的圖片集成到自己的應用或服務中。
 

Bing creator使用點數系統進行運算力的兌換,官方每天會提供 25 點的消耗點,這些點數可以加快生成圖片速度。有趣的是使用者可以通過 Microsoft Rewards 兌換更多點數,Microsoft Rewards 包含了使用Bing搜尋引擎探索藝術家的畫風、或是挖掘新的知識等,使用者在學習新知之餘還能將其應用於圖像生成中,帶有一定程度上的教育意味。

 

小結

文字產生圖片(Text-2-Img)目前網路上已經有許多眼花撩亂的選擇,本文只列出了三種熱門的工具作為參考。或許在不久的將來,這些技術會成為我們所習慣的日常,深深地改變我們在廣告、教育、創作等方方面面領域的工作型態與流程。正如同攝影技術的崛起導致繪畫界遭受衝擊一般,這種原先被認為是技術的能力某部分被機器所取代的時刻在未來想必只會愈來愈多,因此我們要如何與這些工具協作以及反思創作者的價值就是一值得被探討的議題。