米哈遊創始人蔡浩宇AI公司發表最新影片生成模型論文

上證報中國證券網訊(記者 羅茂林)4月10日,米哈遊創始人蔡浩宇旗下AI公司Anuttacon在arXiv釋出論文,公開其新一代影片生成模型LPM 1.0(Large Performance Model)論文。 據論文介紹,LPM 1.0是一個基於170億引數擴散Transformer架構的影片模型,主打角色表演生成能力。與傳統影片生成模型相比,該模型不僅關注畫面生成,還嘗試實現角色在影片中的連續表達,包括說話、傾聽和即時反應,更注重於“表演”。 該模型可以根據輸入影像生成具有穩定身份特徵的影片角色,在對話過程中保持外觀與行為一致,同時完成語音驅動、表情變化和動作反饋。 值得一提是,有媒體注意到,論文專案標註的Project Lead包括曾愛玲(Ailing Zeng)。其個人主頁顯示目前就職於Anuttacon。據悉,曾愛玲此前在騰訊混元團隊及AI Lab從事計算機視覺與生成模型相關研究工作。

上證報中國證券網訊(記者 羅茂林)4月10日,米哈遊創始人蔡浩宇旗下AI公司Anuttacon在arXiv釋出論文,公開其新一代影片生成模型LPM 1.0(Large Performance Model)論文

據論文介紹,LPM 1.0是一個基於170億引數擴散Transformer架構的影片模型,主打角色表演生成能力論文。與傳統影片生成模型相比,該模型不僅關注畫面生成,還嘗試實現角色在影片中的連續表達,包括說話、傾聽和即時反應,更注重於“表演”。

該模型可以根據輸入影像生成具有穩定身份特徵的影片角色,在對話過程中保持外觀與行為一致,同時完成語音驅動、表情變化和動作反饋論文

值得一提是,有媒體注意到,論文專案標註的Project Lead包括曾愛玲(Ailing Zeng)論文。其個人主頁顯示目前就職於Anuttacon。據悉,曾愛玲此前在騰訊混元團隊及AI Lab從事計算機視覺與生成模型相關研究工作。

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:[email protected]

本文連結://whnzzy.com/post/29398.html

🌐 /