影像生成:Gemini Omni Flash
Google I/O 2026 開發者大會發表的 Gemini Omni Flash,將 Gemini 的多模態推理能力、影像創作和編輯結合在一起。Gemini Omni Flash 即日起在 Google AI Studio 和 Gemini API 上,以公開預覽形式開放使用。
Gemini Omni Flash 能以文字、圖片、影片(現階段最長 3 秒的影片參考內容)輸入組合進行創作和編輯,並以 Gemini 自身對於歷史、生物學及敘事邏輯等各種領域的知識,建構出引人入勝的影片。但在切換場景或進行平移動作時,Gemini Omni Flash 對角色一致性仍有限制。
Gemini Omni Flash 透過 Gemini API 和 Google AI Studio 提供開發者使用,可生成 10 秒鐘影片,更長的版本即也將推出。這款工具的收費極具競爭力,影片輸出成本為每秒 0.1 美元,與 Veo 3.1 Fast 相同。
Google 指出,將 Nano Banana 2 Lite 作為高速的圖像生成工具來運用,接著將圖片以參考素材的形式交給 Gemini Omni Flash,進一步生成高品質影片,大大發揮 Nano Banana、Gemini Omni 二款工具優勢、創造效益。