Copyright 2015-2024 多趣味 版權所有 京ICP備2015051670號
5月28日消息,騰訊混元正式發布并開源語音數字人模型HunyuanVideo - Avatar。該模型由騰訊混元視頻大模型(HunyuanVideo)與騰訊音樂天琴實驗室MuseV技術聯合研發而成。它具備強大功能,支持頭肩、半身與全身景別,可適用于多風格、多物種與雙人場景,能為視頻創作者提供高一致性、高動態性的視頻生成能力。用戶只需上傳人物圖像與音頻,HunyuanVideo - Avatar模型便能自動對圖片和音頻進行解析,包括識別出人物所處環境、音頻蘊含的情感等,進而讓圖中人物自然地說話或唱歌,生成帶有自然表情、唇形同步且包含全身動作的視頻。(財聯社)