【公報廣場】前所未見的革新:決戰AI繪圖

(相片提供/Pixabay)

◉ZM

AI繪圖近年受到關注,為什麼大公司會紛紛投入資源開發,它到底能做些什麼,又有哪些弱點呢?

細數當前的AI繪圖服務,最多人知道的,或許是先前流行把自己的照片放進去,然後就能美化成動漫風格頭像的「美圖秀秀」。而在變身之外,它還能將僅有簡單筆畫構圖的草稿與塗鴉轉化成相當精美的成稿,吸引很多使用者在社群上發表自己的傑作。哪怕使用者能操作的步驟相當有限,卻也簡單好玩。

實際上,當前現在AI繪圖服務以Stable Diffusion和Midjourney為首。前者是由Stability AI在OpenAI的支持下開發的免費開源工具,除了「以圖成圖」外,還能以文字描述生成圖像。資深的使用者甚至可以修改和調整AI運算模型,使AI更精熟地繪製指定風格和角色,專長在有明確的繪製目標與對象。

Midjourney則是同名公司推出的商業服務,搭載於語音通訊平台Discord上,試用後必須訂閱才能繼續使用。雖然同樣是以文生圖,但隨著不斷更新與進化,除了更具普遍性於生成各種風格的藝術品,也更具隨機性,適合用於概念發想。不懂得繪圖技巧的人也能輸入被稱為「咒語詠唱」的關鍵字,把腦海中的構想具象化,這樣的創作方式成為這波風潮的引爆點。

只是,這樣的繪圖方式也還有許多破綻存在。原理上AI是從過往的數據資料進行深度學習,並推測使用者描述的圖像如何呈現,在結構上對於許多事物缺乏基礎的理解。舉例來說,AI在畫人類時,肢體的數量容易繪出差錯,又以手指最為頻繁,不時多一根或少一根手指;在場景與物件上細節也往往不明所以,進而組成詭異怪誕的圖像,要真的以假亂真為時尚早。

儘管如此,隨著技術的發展,AI繪圖在品質和效率方面必然再進一步的提升。屆時,美術人員是真的會被AI取代,又或者以其他形式結合共存呢?我們拭目以待。 (作者為軟體工程師)

廣告/手到心至抄寫本-箴言

我有話要說