〈AWS雲端年會〉亞馬遜秀自家Nova系列AI模型 明年Q1推生成式語音模型

鉅亨網記者魏志豪 美國拉斯維加斯
亞馬遜執行長Andy Jassy。(鉅亨網記者魏志豪攝)
Tag

亞馬遜 (AMZN-US) 執行長 Andy Jassy 今 (3) 日親自為 AWS re:Invent 2024 站台,並在會中宣布推出自家 Nova 系列生成式 AI 模型,並提供給客戶四種版本,也針對自動生成圖片與影片分別推出 Nova Canvas 與 Nova Reel,更釋出 Nova Any-to-Any,實現文字、語音、圖像與影片間相互轉譯的可能。

Andy Jassy 指出,儘管目前已有各式各樣的模型,但客戶還是很難找到一個具備正確知識、成本效益和低延遲組合且最適合其業務需求的模型,以大模型來看,知識較豐富、但成本高,反應時間較長,而小模型運行速度快、成本較低,但能力較差。

因此,亞馬遜藉由模型蒸餾 (Model Distillation) 技術,將大模型的知識壓縮轉移至小模型,同時保留小模型性能特徵,並在自家 Bedrock 平台上運行,讓客戶可以在同一模型中選擇自己所需大小的模型。

亞馬遜此次針對 Nova 系列推出四種規格,包含 Micro、Lite、Pro 與 Premier,前三款已經可提供給 AWS 用戶使用,Premier 則預計年第一季推出,並預估 Nova 系列模型可較現有平台上的模型節省 75% 的成本。

亞馬遜此次也同步推出 Nova Canvas 和 Nova Reel,分別為圖片、影音的生成式模型;Andy Jassy 說,其模型已幫助亞馬遜消除賣家和廣告業者間的障礙,如在影片廣告中可以為產品建立關鍵字等新策略,依據單一影片曝光的產品數量是先前的 5 倍,每個廣告中的圖片數量是原來的 2 倍,讓預算更精準投放。

另外,Andy Jassy 也說,亞馬遜已將技術延伸至語音生成語音 (Speech to Speech) 的模型,預計明年第一季推出,並在未來進一步推出任何形式均可輸入、生成的模型,代表使用者可透過文字生成語音、影片內容轉換為文字或者文字生成圖片等,實現更多元的應用場景。

亞馬遜 Nova 四款模型。(鉅亨網記者魏志豪攝)
亞馬遜即將推出的兩款 Nova 模型。(鉅亨網記者魏志豪攝)