半小時教你手搓AI視頻通話,還有懶人版代碼已開源

AIGC動態(tài)歡迎閱讀
原標(biāo)題:半小時教你手搓AI視頻通話,還有懶人版代碼已開源
關(guān)鍵字:模型,視頻,文本,網(wǎng)友,模塊
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAIGPT-4o的“AI視頻通話”一鴿再鴿,但網(wǎng)友卻是急不可耐想要體驗。
于是,一位名叫Santiago(我們叫他三哥)的博主,用160行Python代碼嘗試了復(fù)刻。
雖然技術(shù)路線和《Her》有所差別,但從直觀效果來看,也算得上是給網(wǎng)友們帶來了新的玩具。
而且不僅是炫技,三哥是真的在試圖把網(wǎng)友教會,用了半個多小時的時間講解他的操作過程。
不過,三哥的自我介紹中說,自己是一個講授硬核機器學(xué)習(xí)知識的博主,之前也推出過不少課程。
所以講課這件事對三哥來說,也可以算是老本行了。
對三哥這次推出的新課,網(wǎng)友給予了很高的評價,表示不僅內(nèi)容很贊,而且講解得也很好。
甚至為了防止你覺得學(xué)起來太麻煩,三哥直接就把程序代碼給公開了。
還有網(wǎng)友在線催更,有的想要增加屏幕讀取的功能,還有人想要移動版……
用Python實現(xiàn)AI視頻通話三哥做的視頻通話程序名叫Alloy Voice Assistant(簡稱Alloy),在視頻中他演示了這樣幾組對話效果。
首先是一道基礎(chǔ)問題,三哥讓Alloy識別一下自己戴的眼鏡是什么顏色。
這道題對Alloy來說確實是沒什么難度,
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...

粵公網(wǎng)安備 44011502001135號