中國國家互聯網信息辦公室周四 (18 日) 發布了第四批深度合成服務演算法備案資訊的公告。 從公布的清單中可以看到,共有 266 家廠商通過,涉及影像生成、視訊生成、數字人、智慧對話等多個種類,應用範圍涵蓋教育、遊戲、電商等多個產業,阿里 (09988-HK)(BABA-US) 、騰訊 (00700)、百度 (09888-HK)(BIDU-US)、網易 (09999-HK) 等網路企業,vivo、小米、OPPO 等手機廠商,美的 (000333-CN)、TCL(000100-CN) 等家電廠商均名列其中。
中國《互聯網資訊服務深度合成管理規定》第十九條明確規定,具有輿論屬性或社會動員能力的深度合成服務提供者,應按照《互聯網資訊服務演算法推薦管理規定》履行備案和變更、註銷備案手續。 深度合成服務技術支持者應參照履行備案及變更、註銷備案手續。
據陸媒《科創板日報》報導,在知名網路企業中,阿里、京東、百度等均有演算法在列。 阿里達摩院的服飾上身合成演算法,可依照使用者上傳的服飾參考圖和模特兒圖,將服飾圖裡的服飾融合到模特兒身上,產生對應服飾商品的廣告圖。
阿里旗下夸克 APP 的圖像智慧擦除演算法應用於圖像編輯場景,對用戶上傳的圖像進行擦除操作和背景填充,實現對圖像中手寫、水印或指定區域的內容擦除功能。
京東分別有文生圖模型演算法、領航者智慧資源位元生成演算法在此次公告中。 領航者智慧資源位產生演算法,根據用戶輸入的文字和圖像數據,產生符合用戶需求行銷資源點陣圖像。
百度的人臉融合及屬性編輯演算法,可依使用者輸入的影像或影片數據,產生符合使用者需求的影像內容,實現人臉融合、屬性編輯等功能。
網易則涉及了網易伏羲三維場景重建演算法、網易外貿生成合成演算法、網易有道文件問答演算法、網易元氣生成合成演算法。 其中,網易伏羲三維場景重建演算法根據使用者輸入的影像或視頻,產生對應的三維網格模型。 剩下三種演算法主要用於產生符合使用者需求的文字內容。
騰訊共有 5 款演算法位元列清單,分別為 QQ 智慧影像模型演算法、騰訊會議智慧對話演算法、天天 P 圖人臉變換演算法、騰訊智影繪畫生成演算法、騰訊數字人視訊合成演算法、騰訊雲智繪圖 背景替換演算法、應用寶圖像融合演算法。
華為雲有三款數字人演算法進行備案公示,分別為 MetaStudio 數字人視覺驅動演算法、MetaStudio 分身數字人驅動演算法、MetaStudio 數字人語音驅動演算法,用於產生數字人視訊。
TCL、美的、海爾這些家電企業的多個大模型演算法,主要用於人機對話的文本回應。 例如,TCL 智慧助理演算法應用於智慧對話場景,根據使用者輸入的文字訊息,產生符合使用者需求的文字回复,提供家電產品說明和功能使用指導。 美的美言大模型演算法用於家電人機互動服務,可根據使用者輸入的文字數據,產生符合使用者需求的文字內容。
手機企業則包含了小米大語言模型演算法、vivo AI 繪畫演算法、vivo 藍心大模型演算法,涵蓋文生、文生圖的場景。