ChatGPT 母公司 OpenAI 將於美國時間周一 (13 日) 舉辦新品發表會,以搶在競爭對手 Google(GOOGL-US) 一系列產品發佈之前,至於要發表什麼新品,執行長奧特曼則語帶保留,並在社群平台 X 上明確否認市場上猜測的 GPT-5 或 AI 搜尋引擎。
奧特曼希望最終開發出一種類似電影《她》中的 AI 助手,並以這種技術支援蘋果 (AAPL-US) Siri 等現有語音助手。
《彭博資訊》日前引述知情人士報導指出,蘋果跟 OpenAI 接近達成協定,將在 iOS 18 中使用後者的技術,強化 Siri 的功能,雙方預計會在 6 月敲定協議,將 ChatGPT 技術引入下一代作業系統 iOS 18。
去年年初,蘋果高管 Craig Federighi 和負責 AI 業務的副總裁 John Giannandrea 去年花數周時間測試 ChatGPT 後認為,相較於生成式人 AI,Siri 已經過時了。在測試過 ChatGPT 後,蘋果就進行十多年來規模最大的重組,將資源集中於 AI 方向,並在今年初取消蘋果汽車專案後,大部分工程師都轉入 AI 團隊,蘋果用於反覆運算 Siri 的研發經費據悉高達每天數百萬美元。
蘋果高層認為,ChatGPT 等聊天機器人背後的大語言模型 (LLM) 可增強 Siri 的能力。
蘋果執行長庫克曾承諾,今年將發表一項重大 AI 產品,蘋果自去年初起一直在測試自有代號為「Ajax」的 LLM,一些蘋果員工還在嘗試一款名為「蘋果 GPT」的基礎聊天機器人,但知情人士透露,蘋果技術仍不如 Google 和其他競爭對手的技術,這使得合作看起來是更好的選擇。
根據蘋果內部人士爆料,蘋果升級 Siri 的目的不是讓它跟 ChatGPT 競爭詩歌創作等內容生成的部分,而是讓 Siri 專注於處理原有的任務,包括設定鬧鐘、建立日曆備忘提醒、新增購物清單中的物品,以及總結簡訊內容。
若全球共 22 億台蘋果 iOS 設備都加入 ChatGPT,OpenAI 運算能力恐無法應付,這也意味著 OpenAI 被迫繼續買入數十萬個輝達 GPU 去支援 22 億人使用 ChatGPT,輝達 (NVDA-US) 業績也有望持續衝高。
OpenAI 已經有了可轉錄音頻和將文本轉換成語音的軟體,但這些功能是透過單獨的 AI 聊天機器人實現,新產品則將這些功能整合在一起,且能更加理解圖像和音訊,回應速度也更快。OpenAI 認為,具視覺和聽覺功能的助手有可能像智慧手機一樣帶來變革,可以觀察使用者所處的環境資訊提供建議,可能使用的例子如擔任家教、翻譯標誌、修理汽車等等。
媒體分析指出,OpenAI 新模型的運作依賴雲端,需要網路連接才能工作,要使具有視覺和聽覺功能的複雜 AI 對話小巧到能在手機等個人設備上運作,恐需時數月甚至好幾年。目前雖不知何時會向付費使用者提供這些功能,但根據《The Information》引述匿名消息人士報導,OpenAI 已經向一些客戶展示一種新的多模態 AI 模型,既能與人對話,又能辨識物體,這可能是 OpenAI 打算在周一展示的一部分內容。
一位知情人士,新軟體的音訊功能可説明客服人員更好地理解來電者的語音語調。
與此同時,Google 則將在周二 (14 日) 下午一點召開的 I/O 大會上公佈模型新進展,據傳將發佈一個名為「Pixie」、由 Gemini 加持的個人數位助理。
市場猜測,Google 也將發佈 Gemini 的新版本以及推出圖像和影片大模型,根據 Reddit 網友爆料,Google 存貨中有 3 個模型已經在測試但還未向公眾發布,這些模型有望在周二亮相。這三個模型分別是影像生成模型 Imagen 3,以及兩個可以讓影像進行最佳化、補強功能的模型 Juno 和 Miro,Miro 據說還有影片生成功能。