OpenAI 周二 (24 日) 宣布,將向 ChatGPT 的更多付費客戶推出高級語音模式 (AVM)。音訊功能使 ChatGPT 的交談更加自然,最初將向 ChatGPT Plus 和 Teams 級別的客戶推出,下周,這些功能將向 OpenAI 企業和教育客戶開放。
據報導,高級語音模式主要特點包括:
全新的語音功能適用於 OpenAI 的 AI 模型 GPT-4o,不適用於最近發布的預覽模型 o1。
OpenAI 指出,先進的語音助理可以用超過 50 種語言說「對不起,我遲到了」,並在社群媒體的貼文中附上一段影音,演示用戶可以要求語音助手表達,因為讓奶奶等了很久,向奶奶致歉。影片顯示,AI 助理首先按照要求總結了用戶想要表達的意思,用英語說了一遍,而後,在用戶提示 AI 奶奶只會說中文之後,AI 助手又用標準的中文說了一遍。
這次發布中缺少的另一個功能是:ChatGPT 的影音和螢幕共享,這一功能 OpenAI 在 4 個月前的春季更新期間首次亮相,原本應該讓 GPT-4o 同時處理視覺和聽覺訊息。
儘管如此,OpenAI 表示,自從發布 AVM 的有限 alpha 測試以來,它已經做出了一些改進。據稱,ChatGPT 的語音功能現在可以更好地理解口音,該公司表示其對話也更加流暢和快速。
OpenAI 發言人表示,目前 AVM 尚未在歐盟、英國、瑞士、冰島、挪威和列支敦士登等多個地區推出。