15秒複製出人聲還能多語系 OpenAI新技術太厲害將設限

美國人工智慧（AI）技術開發公司OpenAI開發了利用AI生成文字、圖片和影片的技術後，現在更開發出語音複製工具，可以模仿人聲，但是為了安全顧慮，暫時不打算公開釋出。

OpenAI 29日公開這款新的「語音引擎（Voice Engine）」技術，根據公司公開的初期測試結果，這項技術能夠以令人信服的人聲朗讀文字，與之前生成語音內容不同的是，「語音引擎」能夠以聽起來就像某個人講話的節奏和語調，生成一段談話。

OpenAI宣稱，只要有15秒的真人說話錄音樣本，就可以複製出同一個人說話的聲音，還能生成出不同語言，例如母語為英語者，可以生成用西班牙語、法語、中文或其他語言講話。

《彭博》指出，29日的展示活動上，記者聽了一段OpenAI執行長奧特曼（Sam Altman）簡短解釋這項技術的錄音，聲音聽起來與奧特曼本人講話難以區別，但卻是完全由AI生成的。

不過，為了防範這項技術被濫用，OpenAI目前僅與少數組織和開發員測試這項功能，「現階段還不會廣泛釋出這項技術」。OpenAI在聲明中說，「我們了解生成類似某人聲音的談話有嚴重風險，尤其在選舉年更是備受關注」，初期測試員已經同意，未經當事人同意不會模仿其聲音，而且會揭露以AI生成的語音。

OpenAI一週前為這項技術申請的商標權顯示，目標可能是要進軍語音辨識和數位語音助理業務。改善這類技術最終會有助於OpenAI與亞馬遜（Amazon）的Alexa等其他同類產品業者競爭。自由時報0330

Facebook Comments Box