OpneAI推出語音AI 僅需15秒就可複製逼真人聲

發佈時間：2024/04/01 11:36

國際

小中大

OpneAI對外公開可模仿人聲的生成式AI。圖/翻攝NBC NEWS YouTube頻道

OpneAI對外公開可模仿人聲的生成式AI。圖/翻攝NBC NEWS YouTube頻道

梅花新聞網邱啟霖/綜合報導

推出生成式聊天機器人ChatGPT的美國新創公司巨擘OpneAI，著手進軍語音輔助服務，日前對外公開可模仿人聲的生成式AI，只需錄製一個人短短15秒的說話，就能複製並重現該說話者的人聲。由於安全風險過大，為防在大選年引發混亂，OpneAI表示，暫時還不會全面開放。

這家人工智慧（AI）技術開發公司在提交商標申請後不久，29日公開可再現人聲的生成式AI，命名為語音引擎（Voice Engine）。OpneAI聲稱，只需15秒的錄音，就可以成功複製並合成一個人的聲音，而且還能以說話者的原始語音，轉譯出其他不同的語言。

綜合外電報導，這種語音引擎在兩年前就已出現於OpneAI的實驗室中。該技術可運用於多種實際案例，如透過自然的聲音自動生成預先撰寫的配音內容，為非讀者或兒童提供閱讀輔助。另一案例是協助突發性失語或言語退化的患者恢復聲音。美國布朗大學（Brown University）就一直使用語音引擎進行試驗，希望幫助那些癌症或神經系統疾病的患者治療語言障礙。

不過，OpenAI表示，由於擔心新技術有遭濫用的風險，目前僅供合作夥伴使用，暫時不會對外開放，也未公布正式推出時程，讓OpenAI有更多時間測試，以防功能遭不法濫用。

OpenAI產品團隊的成員哈里斯（Jeff Harris）在接受科技媒體TechCrunch訪問時表示：「我們了解新技術的潛在風險，並已採取適當措施來降低這些風險。」

OpenAI在一份聲明中也提到：「我們體認到，生成類似於人聲的技術，存在嚴重風險，在大選年尤其值得關注。」OpenAI指出，現階段這項服務有必要採取防止濫用的對策，例如，建立「防止複製名人聲音」機制。

生成式AI的崛起，已開始令人擔心有心人士可能用其來製造政治混亂。今年1月，美國總統初選前夕，新罕布什爾州數千選民收到AI自動語音電話（robocall），這些電話模仿美國總統拜登（Joe Biden）的聲音，引發外界關注。