Google推出最新AI工具Whisk 靠圖像生成圖像

Google於17日宣布推出最新人工智慧工具Whisk，這款創新工具讓用戶僅需上傳圖像即可生成新的AI圖像。目前Whisk僅開放美國用戶測試，並在Google Labs平台上運行。

綜合外媒報導，Whisk結合了Google最新推出的核心AI系統Gemini，以及DeepMind的文本轉圖像生成模型Imagen 3。當用戶上傳圖像後，Gemini會先生成一段簡短的描述，並將其輸入到Imagen 3中，最終生成一張全新的AI圖像。

用戶可以上傳多張圖像，分別描述主題、場景與風格，Whisk將自動融合這些要素，生成一張全新影像。此外，用戶若無合適的圖片作為指令，也可點擊骰子圖示，使用 Whisk自動生成的隨機圖像作為參考基礎，甚至還可加入文字補充，以更精確地調整結果。

Google強調，Whisk旨在捕捉圖像的「精隨」，而非精準複製原圖內容，因此生成結果可能會偏離原始指令，例如人物的高度、髮型或膚色可能與提供的素材不同。

Google Labs產品管理主任表示，「Whisk的目的在於讓用戶以全新且有創意的方式混搭主題、場景與風格，進行快速的視覺探索，而不是進行像素級的精細編輯。」

用戶還可對生成的圖像進行「重混」操作，透過調整輸入圖片或增加文字，生成新版本的圖像。例如，用戶可以設計卡通形象、周邊商品如貼紙或徽章等，輕鬆探索不同風格與主題的可能性。

目前，Whisk尚處於早期開發階段，僅對美國地區的測試用戶開放，並計劃未來進一步拓展應用範圍。Google 同時警告，由於工具仍在優化過程中，生成的圖像可能「偏離用戶預期」。自由時報1218

Facebook Comments Box