AIGC動態歡迎閱讀
原標題:成立半年就敢踢館 OpenAI ,首個開源模型不輸 GPT-4o,LeCun 、PyTorch 之父齊聲叫好!
關鍵字:模型,語音,華為,音頻,文本
文章來源:AI前線
內容字數:0字
內容摘要:
整理 | 華衛
想象一下,一個 AI 模型可以表達 70 多種情緒,以不同的風格說話,甚至令人信服地模仿口音。并且,它能夠同時處理兩個音頻流,同時聽和說。這不是科幻小說,而是 Kyutai 在語音 AI 技術上的最新突破。
只用短短 6 個月的時間,這個由 8 人組成的非營利性 AI 研究實驗室從零開發出了一種名為 “Moshi “的實時原生多模態基礎 AI 模型。根據 Kyutai 的說法,Moshi 是世界上首個具有自然對話能力的可公開訪問 AI 助手。OpenAI 之前曾展示過 GPT-4o 的語音引擎和語音模式功能,但尚未發布。
據稱,該模型具備的功能可與 OpenAI 的 GPT-4o 和 Google Astra 相媲美,但模型要小得多。“Moshi 在說話時思考。”Kyutai 首席執行官帕特里克·佩雷斯 (Patrick Pérez) 表示,Moshi 具有徹底改變人機通信的潛力。
7 月 4 日,Kyutai 在法國巴黎公開發布了 Moshi 的實驗原型,用戶可以在網上測試體驗(https://moshi.chat/?queue_id=talktomoshi)。值
原文鏈接:成立半年就敢踢館 OpenAI ,首個開源模型不輸 GPT-4o,LeCun 、PyTorch 之父齊聲叫好!
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...