OpenAI干翻所有語音助手!GPT-4o模型實(shí)時(shí)語音視頻交互強(qiáng)到恐怖,完全免費(fèi)開放
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI干翻所有語音助手!GPT-4o模型實(shí)時(shí)語音視頻交互強(qiáng)到恐怖,完全免費(fèi)開放
關(guān)鍵字:模型,解讀,用戶,語音,文本
文章來源:算法邦
內(nèi)容字?jǐn)?shù):9473字
內(nèi)容摘要:
智東西5月14日報(bào)道,今日凌晨1點(diǎn),搶在谷歌年度開發(fā)者大會(huì)Google I/O開幕前,OpenAI舉辦春季線上直播,宣布將推出桌面版ChatGPT,并發(fā)布全新旗艦AI模型GPT-4o。
GPT-4o向所有人免費(fèi)開放,可實(shí)時(shí)跨文本、音頻、視覺(圖像與視頻)進(jìn)行推理,API定價(jià)只有GPT-4 Turbo的一半,速度達(dá)到GPT-4 Turbo的2倍。付費(fèi)的ChatGPT Plus用戶將獲得5倍調(diào)用額度,并能最早訪問其全新macOS桌面App和下一代語音及視頻功能。這次OpenAI對AI機(jī)器人ChatGPT的升級(jí)依然“直擊人心”,實(shí)時(shí)語音翻譯能力自然流暢,感覺能直接取代同聲傳譯了。
不僅反應(yīng)快、回答準(zhǔn),它還能按要求改變說話語氣,從冰冷機(jī)械到幽默嬌羞都信手拈來,而且能隨時(shí)高歌一曲,聽起來與真人無異。
除了語音外,GPT-4o可以進(jìn)行實(shí)時(shí)視頻交互了!比如通過視頻影像理解線性方程,還學(xué)會(huì)了“看臉色行事”,能通過人的表情和語調(diào)理解并判斷出人的情緒。▲GPT-4o識(shí)別了視頻中的文字并作出嬌羞的反應(yīng)
更有甚者,它能直接看你的屏幕,并根據(jù)看到的內(nèi)容回答你的提問。比如當(dāng)你展示一段代碼,它會(huì)進(jìn)行理解并告
原文鏈接:OpenAI干翻所有語音助手!GPT-4o模型實(shí)時(shí)語音視頻交互強(qiáng)到恐怖,完全免費(fèi)開放
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號(hào)之一,聚焦生成式AI,重點(diǎn)關(guān)注模型與應(yīng)用。