推出生成式聊天機器人ChatGPT的美國新創公司巨擘OpneAI,著手進軍語音輔助服務,日前對外公開可模仿人聲的生成式AI,只需錄製一個人短短15秒的說話,就能複製並重現該說話者的人聲。由於安全風險過大,為防在大選年引發混亂,OpneAI表示,暫時還不會全面開放。
這家人工智慧 (AI)技術開發公司在提交商標申請後不久,29日公開可再現人聲的生成式AI,命名為語音引擎(Voice Engine)。OpneAI聲稱,只需15秒的錄音,就可以成功複製並合成一個人的聲音,而且還能以說話者的原始語音,轉譯出其他不同的語言。
綜合外電報導,這種語音引擎在兩年前就已出現於OpneAI的實驗室中。該技術可運用於多種實際案例,如透過自然的聲音自動生成預先撰寫的配音內容,為非讀者或兒童提供閱讀輔助。另一案例是協助突發性失語或言語退化的患者恢復聲音。美國布朗大學(Brown University)就一直使用語音引擎進行試驗,希望幫助那些癌症或神經系統疾病的患者治療語言障礙。
不過,OpenAI表示,由於擔心新技術有遭濫用的風險,目前僅供合作夥伴使用,暫時不會對外開放,也未公布正式推出時程,讓OpenAI有更多時間測試,以防功能遭不法濫用。
OpenAI產品團隊的成員哈里斯(Jeff Harris)在接受科技媒體TechCrunch訪問時表示:「我們了解新技術的潛在風險,並已採取適當措施來降低這些風險。」
OpenAI在一份聲明中也提到:「我們體認到,生成類似於人聲的技術,存在嚴重風險,在大選年尤其值得關注。」OpenAI指出,現階段這項服務有必要採取防止濫用的對策,例如,建立「防止複製名人聲音」機制。
生成式AI的崛起,已開始令人擔心有心人士可能用其來製造政治混亂。今年1月,美國總統初選前夕,新罕布什爾州數千選民收到AI自動語音電話(robocall),這些電話模仿美國總統拜登(Joe Biden)的聲音,引發外界關注。