OpenAI的《Her》難產(chǎn),是被什么困住了手腳?
AIGC動態(tài)歡迎閱讀
原標(biāo)題:OpenAI的《Her》難產(chǎn),是被什么困住了手腳?
關(guān)鍵字:模型,小米,語音,實時,信號
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI兩個月又兩周過去了,我們?nèi)匀粵]有見到公開發(fā)布版的OpenAI《Her》。
5月14日,OpenAI發(fā)布GPT-4o和端到端實時音視頻對話模式,現(xiàn)場演示AI對話絲滑如人類。
它能感受到你的呼吸節(jié)奏,也能用比以前更豐富的語氣實時回復(fù),甚至可以做到隨時打斷AI,效果非常驚艷。
可萬眾期待中,不時有推遲的消息傳出。
是什么拖住了OpenAI的后腿?根據(jù)已知情報:
有法律糾紛,要確保語音音色不會再出現(xiàn)與“寡姐”斯佳麗·約翰遜這樣的爭議。
也有安全問題,需要做好對齊,以及實時音視頻對話開啟新的使用場景,被當(dāng)成詐騙工具也會是其中之一。
……
不過,除了以上這些,還有什么技術(shù)問題和困難需要克服嗎?
渡過最初的熱鬧后,內(nèi)行們開始看門道了。
眼尖的網(wǎng)友可能已經(jīng)注意到,發(fā)布會現(xiàn)場演示手機(jī)可是插著網(wǎng)線的。
在業(yè)內(nèi)人士眼中,GPT-4o發(fā)布會演示效果如此絲滑,還是有幾大限制:
需要“固定網(wǎng)絡(luò)、固定設(shè)備、固定物理環(huán)境”。
真的公開發(fā)布后,全球用戶能否獲得與發(fā)布會相比不打折扣的體驗,也還是個未知數(shù)。
發(fā)布會現(xiàn)場還有一個有趣的細(xì)節(jié),帥氣的研究員小哥Barret Zop
原文鏈接:OpenAI的《Her》難產(chǎn),是被什么困住了手腳?
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: