Google於17日宣布推出最新人工智慧工具Whisk,這款創新工具讓用戶僅需上傳圖像即可生成新的AI圖像。目前Whisk僅開放美國用戶測試,並在Google Labs平台上運行。
綜合外媒報導,Whisk結合了Google最新推出的核心AI系統Gemini,以及DeepMind的文本轉圖像生成模型Imagen 3。當用戶上傳圖像後,Gemini會先生成一段簡短的描述,並將其輸入到Imagen 3中,最終生成一張全新的AI圖像。
用戶可以上傳多張圖像,分別描述主題、場景與風格,Whisk將自動融合這些要素,生成一張全新影像。此外,用戶若無合適的圖片作為指令,也可點擊骰子圖示,使用 Whisk自動生成的隨機圖像作為參考基礎,甚至還可加入文字補充,以更精確地調整結果。
Google強調,Whisk旨在捕捉圖像的「精隨」,而非精準複製原圖內容,因此生成結果可能會偏離原始指令,例如人物的高度、髮型或膚色可能與提供的素材不同。
Google Labs產品管理主任表示,「Whisk的目的在於讓用戶以全新且有創意的方式混搭主題、場景與風格,進行快速的視覺探索,而不是進行像素級的精細編輯。」
用戶還可對生成的圖像進行「重混」操作,透過調整輸入圖片或增加文字,生成新版本的圖像。例如,用戶可以設計卡通形象、周邊商品如貼紙或徽章等,輕鬆探索不同風格與主題的可能性。
目前,Whisk尚處於早期開發階段,僅對美國地區的測試用戶開放,並計劃未來進一步拓展應用範圍。Google 同時警告,由於工具仍在優化過程中,生成的圖像可能「偏離用戶預期」。自由時報1218