標簽:語音

地表最強人形機器人問世!擎天柱頭號勁敵,每天工作20小時,前代已進寶馬打工

OpenAI英偉達微軟都投的人形機器人,更酷炫了。 作者|香草 編輯|心緣 智東西8月7日報道,昨晚,由微軟OpenAI英偉達英特爾聯手投資的明星機器人創企Figure,發...
閱讀原文

ChatGPT版「Her」被玩瘋:哭著讀詩,中文表現也很亮

金磊 發自 凹非寺量子位 | 公眾號 QbitAI上線僅僅一天,GPT-4o的高級語音功能(Advanced Voice Mode)簡直要被玩瘋了。 無數網友腦洞大開的瘋狂測試,GPT-4o...
閱讀原文

GPT-4o 語音模式終于來了,首批測試網友已經玩瘋了

趕在 7 月結束前,GPT-4o 語音功能終于開啟。現開啟灰度測試,一小部分 ChatGPT Plus 用戶已經可以試用。 如果打開 ChatGPT App 之后看到了下面這個界面,恭...
閱讀原文

重磅驚喜!OpenAI突然上線GPT-4o超長輸出模型!「Her」高級語音模式已開放測試!

夕小瑤科技說 原創作者 | 海野在最近的大模型戰爭中,OpenAI似乎很難維持霸主地位。雖然沒有具體的數據統計,但Claude3.5出現后,只是看網友們的評論,就能感...
閱讀原文

GPT-4o版「Her」終于來了!講笑話、學貓叫,AI女友能有多?

新智元報道編輯:桃子 好困 【新智元導讀】GPT-4o語音功能終于如期而至,科幻版Her走進現實!一些灰度測試到的網友們已經玩瘋了,不過,OpenAI目前只給了4種...
閱讀原文

OpenAI 發布了一款可以和它交談的新型 ChatGPT 機器人

點擊上方藍字關注我們OpenAI 正向少數 ChatGPT Plus 訂閱用戶推出 ChatGPT 的全新高級語音功能。這一在五月份 GPT-4o 發布活動上亮相的功能,因聲音與斯嘉麗·...
閱讀原文

AI也會「刷抖音」!清華領銜發布短視頻全模態理解新模型 | ICML 2024

新智元報道編輯:LRST 好困 【新智元導讀】音視頻大語言模型在處理視頻內容時,往往未能充分發揮語音的作用。video-SALMONN模型通過三部分創新:音視頻編碼和...
閱讀原文

GPT-4o 最關鍵功能本周上線,語音交互的時代終于要來了

Voice Agent 是與人類進行對話溝通的 AI,是下一代人機交互界面。和文本相比,聲音交互的優勢主要體現在: ? 語音交互以其與人類自然溝通方式的高度一致性,...
閱讀原文

Sam Altman親自確認:下周開始推送GPT-4o實時語音功能!

? ?9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業部高級總監王宏強,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲,珠海芯動...
閱讀原文

OpenAI的《Her》難產,是被什么困住了手腳?

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI兩個月又兩周過去了,我們仍然沒有見到公開發布版的OpenAI《Her》。 5月14日,OpenAI發布GPT-4o和端到端實時音視頻對...
閱讀原文

語音克隆達到人類水平,微軟全新VALL-E 2模型讓DeepFake堪比配音員

新智元報道編輯:喬楊 【新智元導讀】繼去年初的第一代VALL-E模型之后,微軟最近又上新了VALL-E 2模型,標志著第一個在合成語音穩健性、相似度、自然程度等方...
閱讀原文

香港理工大學 MIND 實驗室招收進化計算/類腦計算/語音信號處理等方向全獎博士生/博士后

學校簡介 香港理工大學 (The Hong Kong Polytechnic University) 是一所位于中國香港的公立綜合性研究型大學, 坐落于香港九龍紅磡灣。在2024-25年度,香港理...
閱讀原文

劍橋大學:基于語音的大模型攻擊,輕松“操縱”多模態大模型

夕小瑤科技說 原創作者 | Richard隨著人工智能技術的快速發展,基于語音的大模型正在成為一個熱門領域。這些模型不僅能實現語音識別,還可以執行翻譯等多種任...
閱讀原文

阿里開源語音處理模型 FunAudioLLM :50 種語言無縫翻譯,還能識別語音情緒

作者 | 趙明華 阿里巴巴通義實驗室近日發布并開源了 FunAudioLLM,這是一個旨在增強人與大型語言模型(LLMs)之間自然語音交互的框架,代表了語音處理領域的...
閱讀原文

Groq發布超快LLM引擎,速度讓英偉達望塵莫及

點擊上方藍字關注我們“Groq公司最新推出的LLM引擎在速度和智能化方面取得突破,其響應速度達到每秒1256.54個token,遠超Nvidia GPU,為AI應用部署提供了新的...
閱讀原文
12345612