美國人工智慧(AI)公司Open AI周一(13日)推出旗艦AI模型升級的新版本「GPT-4o」,能進行逼真的語音對話,不僅速度更快、更便宜,也更容易使用,而且將免費開放給所有用戶。這是該公司在擴大其Chat GPT應用的最新力作,而同時Google和其他科技巨頭也正在競相推出新的AI技術。
法新社報導,就在Google準備宣布足以抗衡ChatGPT的AI工具Gemini前夕,Open AI宣告對旗艦產品Chat GPT進行更新。
OpenAI技術長穆拉提(Mira Murati)在美國舊金山的發表會中說:「非常、非常興奮將GPT-4o帶給我們所有免費用戶。」他表示,最新模型能更好地消化圖片、影音短片與文字,還能透過語音與人類即時互動。
OpenAI公司表示,這個新模式將於未來數周整合到OpenAI的產品中。該公司說,人們與新的語音功能交談時,能夠隨時打斷它,這和當前市面上的語音助理不同,而且新模型幾乎能夠即時地回話。
OpenAI還表示,新模型還可以透過語調或臉部表情來偵測人的情緒。它也可以迅速轉換不同的情緒語調,例如從戲劇化的聲音轉換成機器人聲調或是唱歌。
Google將召開年度開發者大會,預料Google將在大會上宣布自家的新產品。作為AI先驅的Google與OpenAI長期處於競爭關係,爭奪生成式AI的領導地位。
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx