標簽:語音

OpenAI DevDay公布五項重大創新,AI實時語音的時代來了!成本比GPT-3降低近1000倍!

OpenAI在昨天的DevDay上,公布了五項重大創新:實時API、提示詞緩存、模型蒸餾、視覺微調、新廣場玩法。 這些新能力似乎預示了OpenAI的戰略重心的變化——加大...
閱讀原文

乏善可陳的第二屆OpenAI開發者大會,果然沒有掀起太瀾

機器之心報道 編輯:楊文、杜偉OpenAI宮斗后的 DevDay 開發者大會,沒有什么驚喜。OpenAI 的宮斗大戲剛落下帷幕,今日凌晨就在舊金山召開了第二屆 DevDay 開...
閱讀原文

mini-GPT4o來了? 能看、能聽、會說,還情感豐富的多模態全能助手EMOVA

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

OpenAI DevDay:Realtime 實時多模態 API、緩存折扣、視覺微調,全是利好開發者的

OpenAI在昨天的DevDay上,公布了五項重大創新:實時API、提示詞緩存、模型蒸餾、視覺微調、新廣場玩法。 這些新能力似乎預示了OpenAI的戰略重心的變化——加大...
閱讀原文

AI音頻成詐騙神器!律師父親險被騙走21萬,3秒原聲即可克隆聲音

新智元報道編輯:編輯部 HXY 【新智元導讀】Deepfake到底有多可怕?國外一名律師的父親,險些陷入一場巨大AI騙局。詐騙者借助AI克隆其兒子的聲音,偽造車禍事...
閱讀原文

三只羊盧總的醉酒錄音,說方言吐臟話,AI合成能到嗎

夕小瑤科技說 原創作者 | 付奶茶家人們,大家最近刷三只羊的瓜么了! 先是騙人造假賣月餅 后面又出錄音門。月餅這個事非常可恨,一點沒得洗。但是就在昨晚,...
閱讀原文

150萬條多語種音頻數據!浙大清華發布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024

新智元報道編輯:LRST 【新智元導讀】SafeEar是一種內容隱私保護的語音偽造檢測方法,其核心是設計基于神經音頻編解碼器的解耦模型,分離語音聲學與語義信息...
閱讀原文

OpenAI 「Her」高級語音功能全開放!重慶話、北京兒話都賊溜!

夕小瑤科技說 原創作者 | 付奶茶OpenAI的Her終于全面開放了! 今日凌晨,OpenAI公開宣布Her高級語音模式正式全面開放,在OpenAI的移動端APP上即可體驗! 面向...
閱讀原文

終于來了!OpenAI開放GPT-4o高級語音,還用中文說「對不起」

機器之心報道 編輯:陳陳這項高級語音功能,大家可是等了好久。谷歌又被 OpenAI 截胡了。 前腳谷歌剛剛升級完兩款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Fla...
閱讀原文

開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術報告全公開

新智元報道編輯:alan 【新智元導讀】兩個多月前那個對標GPT-4o的端到端語音模型,終于開源了。大神Karpathy體驗之后表示:nice!前段時間技驚四座、劍指GPT-...
閱讀原文

車圈最大AI「黑馬」吉利:自研語音大模型登頂,性能超SOTA 10%

賈浩楠 發自 凹非寺量子位 | 公眾號 QbitAI語音合成大模型賽道,王者一夜易主。 最新HAM-TTS大模型,在發音準確性、自然度和說話人相似度上對比之前SOTA成果V...
閱讀原文

僅用4塊GPU、不到3天訓練出「開源版GPT-4o」,這是國內團隊最新研究

機器之心報道 編輯:小舟、陳陳LLaMA-Omni能夠接收語音指令,同步生成文本和語音響應,響應延遲低至 226ms,低于 GPT-4o 的平均音頻響應延遲 320ms。以 ChatG...
閱讀原文

「Her」主創官宣離職OpenAI,奧特曼真留不住技術人才

魚羊 發自 凹非寺量子位 | 公眾號 QbitAI在OpenAI最早提出打造「Her」想法的的人,也離職創業了。 Alexis Conneau(亞歷克西斯?康諾),OpenAI版「Her」技術...
閱讀原文

科技巨頭打響語音模型之戰!亞馬遜用Claude升級Alexa,Cerebras語音模式快如閃電

新智元報道編輯:喬楊 Frey 【新智元導讀】雖然OpenAI的「Her」還是期貨,但硅谷的科技巨頭們已經開始相繼發力語音模型。前有谷歌的Gemini Live和蘋果的升級...
閱讀原文

外灘大會上,AI應用落地的N種觀點|甲子光年

“AI應用最大的共識是,沒有共識。”作者|趙健?? 每年在上海舉辦的外灘大會,是具有全球影響力的金融科技和前沿科技大會之一,今年已是第三屆。 本屆外灘大會...
閱讀原文
123412