Meta 週五 (4 日) 公布新影音 AI 模型 Movie Gen,可生成最長 16 秒的逼真電影,並配有音效和背景音樂,有意挑戰 OpenAI 的 Sora。
Movie Gen 並非首個能從簡單文本提示生成影片和音訊的多模態 AI 模型,但 Meta 宣稱表現優於競爭對手系統。Meta 表示,該模型在人工測試中表現出色。
該模型可根據簡單文本提示生成全新電影,或修改現有圖片和影音,替換或修改對象和背景。儘管好萊塢電影傳統上以 24 FPS 拍攝,但 Meta 的 16 FPS 也接近專業電影質量。
Movie Gen 亮點之一是其生成最長 45 秒音訊的能力,包括音效和背景音樂,並與生成影片中的動作同步。
然而,Meta 也表示,Movie Gen 的基礎模型目前僅用於研究,尚未公布產品發布的時間表,並需進一步安全測試。