星期一, 16 9 月, 2024
Home即時新聞15秒複製出人聲還能多語系 OpenAI新技術太厲害將設限

15秒複製出人聲還能多語系 OpenAI新技術太厲害將設限

美國人工智慧 (AI)技術開發公司OpenAI開發了利用AI生成文字、圖片和影片的技術後,現在更開發出語音複製工具,可以模仿人聲,但是為了安全顧慮,暫時不打算公開釋出。

OpenAI 29日公開這款新的「語音引擎(Voice Engine)」技術,根據公司公開的初期測試結果,這項技術能夠以令人信服的人聲朗讀文字,與之前生成語音內容不同的是,「語音引擎」能夠以聽起來就像某個人講話的節奏和語調,生成一段談話。

OpenAI宣稱,只要有15秒的真人說話錄音樣本,就可以複製出同一個人說話的聲音,還能生成出不同語言,例如母語為英語者,可以生成用西班牙語、法語、中文或其他語言講話。

《彭博》指出,29日的展示活動上,記者聽了一段OpenAI執行長奧特曼(Sam Altman)簡短解釋這項技術的錄音,聲音聽起來與奧特曼本人講話難以區別,但卻是完全由AI生成的。

不過,為了防範這項技術被濫用,OpenAI目前僅與少數組織和開發員測試這項功能,「現階段還不會廣泛釋出這項技術」。OpenAI在聲明中說,「我們了解生成類似某人聲音的談話有嚴重風險,尤其在選舉年更是備受關注」,初期測試員已經同意,未經當事人同意不會模仿其聲音,而且會揭露以AI生成的語音。

OpenAI一週前為這項技術申請的商標權顯示,目標可能是要進軍語音辨識和數位語音助理業務。改善這類技術最終會有助於OpenAI與亞馬遜(Amazon)的Alexa等其他同類產品業者競爭。自由時報0330

Facebook Comments Box
相關新聞
- Advertisment -

相關分類