開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術(shù)報告全公開
AIGC動態(tài)歡迎閱讀
原標題:開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術(shù)報告全公開
關(guān)鍵字:模型,音頻,報告,語音,卷積
文章來源:新智元
內(nèi)容字數(shù):0字
內(nèi)容摘要:
新智元報道編輯:alan
【新智元導(dǎo)讀】兩個多月前那個對標GPT-4o的端到端語音模型,終于開源了。大神Karpathy體驗之后表示:nice!前段時間技驚四座、劍指GPT-4o的實時語音模型Moshi,終于開源了!
自然,情緒豐富,隨意打斷,拒絕呆板和回合制!
大神Karpathy體驗之后也表示:nice~
來自法國的初創(chuàng)團隊Kyutai,于7月初發(fā)布了這個對標GPT-4o的神奇的端到端語音模型。
2個多月后的今天,他們兌現(xiàn)了自己的承諾,將代碼、模型權(quán)重和一份超長的技術(shù)報告一股腦開源。
論文地址:https://kyutai.org/Moshi.pdf
開源代碼:https://github.com/kyutai-labs/moshi
開放權(quán)重:https://huggingface.co/collections/kyutai
在海的那一邊,GPT-4o的語音模式還沒有完全端上來,這邊的模型已經(jīng)免費送了。
大家可以去官網(wǎng)(moshi.chat)在線免費體驗,相比于平時你問我答的AI語音助手,這種「像人一樣」的方式還是很奇特的。
整個模型的參數(shù)量為7.69B,pytorch平
原文鏈接:開源版GPT-4o來了,AI大神Karpathy盛贊!67頁技術(shù)報告全公開
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...