過去這些假圖常有破綻,容易被人識破;但現在的 AI 生成圖片越來越真,光靠肉眼其實很難分辨是真是假。這種情況可能會讓人誤信假資訊,甚至造成恐慌。更嚴重的話,有人可能會拿這些假的圖片或影片去冒充他人、造謠,還可能涉及法律問題。
那麼現在 AI 能做到的圖片技術有多厲害?
現在的生成式 AI 圖片技術非常強大,其中最早被廣泛研究的技術之一叫做「生成對抗網路」(Generative Adversarial Networks,簡稱 GAN)。它包含兩個角色:一個是「生成器」(Generator),另一個是「辨別器」(Discriminator)。
雖然這位 AI 魔術師能畫出讓人真假難辨的圖片,但它終究是電腦生成的,還是會留下「數位痕跡」。這些痕跡不像畫面中的明顯錯誤,而是藏在圖片的「頻譜」裡。
所謂頻譜,可以透過一種數學工具叫做「傅立葉轉換」來觀察。傅立葉轉換就像一種魔法眼鏡,能把圖片從我們平常看到的樣子,轉換成顯示「變化頻率」的樣子。用這副眼鏡看圖片,真實的照片通常比較自然、不規則,就像畫布上分散的顆粒;但 AI 生成的圖片,在頻譜中常常會出現像「棋盤格」一樣整齊的圖案。以下為真實影像和電腦生成影像的頻譜圖比較。
但問題來了:如果雜點去得太多,會讓圖片變模糊、失真,反而更容易被人眼看出來。所以這個「去除破綻」的過程必須非常小心。一邊去除雜點,一邊讓 AI 辨別器檢查,確保這張圖片還是看起來夠真、不會被識破。這個過程會持續進行,直到圖片的破綻被清除得差不多,而且依然能騙過辨別器為止。我們透過以下流程圖說明這個過程。