原標(biāo)題:HeyGen推出革新性數(shù)字人控制技術(shù),能演奏樂器亦能翩翩起舞
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):1312字
HeyGen:數(shù)字人技術(shù)的新紀(jì)元
視頻內(nèi)容創(chuàng)作正經(jīng)歷一場深刻的變革,而這場變革的引擎正是人工智能。近日,人工智能企業(yè)HeyGen推出的全新數(shù)字人控制系統(tǒng),無疑將這場變革推向了新的。這項技術(shù)不僅在精度和效率上實現(xiàn)了突破,更預(yù)示著數(shù)字人技術(shù)應(yīng)用的無限可能。
精準(zhǔn)操控,栩栩如生
以往的數(shù)字人技術(shù)常常在細(xì)微動作的呈現(xiàn)上顯得力不從心,而HeyGen的最新系統(tǒng)則徹底改變了這一現(xiàn)狀。它實現(xiàn)了對虛擬形象大幅肢體動作的精準(zhǔn)操控,從細(xì)膩的頭部微表情到復(fù)雜的樂器演奏、舞蹈表演,甚至精確到手指關(guān)節(jié)的細(xì)微動作,都能夠流暢自然地展現(xiàn)。演示視頻中,虛擬角色自然抓握鮮花的動作更是令人印象深刻,生動地展現(xiàn)了該技術(shù)的精妙之處。
高效便捷,成本降低
這項技術(shù)的核心在于其底層構(gòu)建的物體交互能力框架。這使得數(shù)字人能夠與虛擬環(huán)境中的物體進(jìn)行真實自然的互動。更重要的是,該系統(tǒng)大幅提升了視頻制作效率。據(jù)數(shù)據(jù)顯示,采用HeyGen系統(tǒng)的視頻制作效率提高了約47%,動態(tài)場景的制作成本降低至傳統(tǒng)方式的八分之一。這對于視頻制作行業(yè)來說,無疑是一場生產(chǎn)力。
顛覆性創(chuàng)新,技術(shù)領(lǐng)先
HeyGen的數(shù)字人技術(shù)與傳統(tǒng)的數(shù)字克隆技術(shù)有著本質(zhì)的區(qū)別。它并非依賴真人建模數(shù)據(jù),而是利用深度神經(jīng)網(wǎng)絡(luò)自主生成具有物理合理性的虛擬形象。通過引入學(xué)控制算法,動作響應(yīng)延遲縮短至12毫秒以內(nèi),制作人員可以進(jìn)行像素級別的精細(xì)控制,從而擺脫了傳統(tǒng)動作捕捉技術(shù)的束縛。
該系統(tǒng)能夠?qū)崟r生成超過200個關(guān)節(jié)點位數(shù)據(jù),并結(jié)合強(qiáng)化學(xué)習(xí)算法,使數(shù)字人的動作呈現(xiàn)出類生物力學(xué)的特征,其逼真程度令人嘆為觀止。這不僅提升了數(shù)字人的視覺效果,更使其在未來的應(yīng)用中擁有了更廣闊的空間。
未來展望,無限可能
HeyGen的創(chuàng)新步伐并未止步于此。工程師團(tuán)隊正在研發(fā)第三代控制系統(tǒng),計劃于2024年底實現(xiàn)數(shù)字人與虛擬物體的真實物理交互功能,這將進(jìn)一步拓展數(shù)字人的應(yīng)用場景,例如在電商產(chǎn)品展示、虛擬教學(xué)、虛擬客服等領(lǐng)域,數(shù)字人將發(fā)揮更大的作用。
總而言之,HeyGen的數(shù)字人控制系統(tǒng)代表著數(shù)字人技術(shù)的一次重大飛躍。其高效、精準(zhǔn)、逼真的特性,將極大地推動視頻內(nèi)容創(chuàng)作領(lǐng)域的變革,并為我們帶來更加豐富多彩的數(shù)字世界。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。