百聆官網(wǎng)
百聆是一個(gè)開源的語音對(duì)話助手,旨在通過語音與用戶進(jìn)行自然的對(duì)話。該項(xiàng)目結(jié)合了語音識(shí)別(ASR)、語音活動(dòng)檢測(cè)(VAD)、大語言模型(LLM)和語音合成(TTS)技術(shù),提供高質(zhì)量的語音對(duì)話體驗(yàn)。其主要優(yōu)點(diǎn)是無需GPU即可實(shí)現(xiàn)類GPT-4o的對(duì)話效果,適用于各種邊緣設(shè)備和低資源環(huán)境。百聆完全開源,鼓勵(lì)社區(qū)貢獻(xiàn)與二次開發(fā),用戶可以根據(jù)自己的需求進(jìn)行定制和優(yōu)化。
百聆是什么?
百聆是一款開源的語音對(duì)話助手,它結(jié)合了語音識(shí)別、語音活動(dòng)檢測(cè)、大語言模型和語音合成技術(shù),能夠?qū)崿F(xiàn)與用戶進(jìn)行自然的語音對(duì)話。與其他同類產(chǎn)品不同的是,百聆無需強(qiáng)大的GPU也能提供接近GPT-4的對(duì)話體驗(yàn),非常適合在各種低配置設(shè)備上運(yùn)行。它支持打斷,并具有持續(xù)學(xué)習(xí)能力,能夠記住用戶的偏好和歷史對(duì)話,提供個(gè)性化的交互體驗(yàn)。

百聆的主要功能
百聆的主要功能包括:語音對(duì)話、信息查詢、任務(wù)管理、雅思口語練習(xí)等。它能夠理解用戶的語音指令,并根據(jù)指令執(zhí)行相應(yīng)的操作,例如查詢天氣、設(shè)置提醒、進(jìn)行對(duì)話練習(xí)等。 百聆還支持工具調(diào)用,可以靈活集成外部工具來擴(kuò)展其功能,提升實(shí)用性。
如何使用百聆?
使用百聆非常簡(jiǎn)單,只需要按照以下步驟操作:
- 克隆項(xiàng)目倉庫:
git clone https://github.com/wwbin2017/bailing.git,然后進(jìn)入項(xiàng)目目錄cd bailing。 - 安裝所需依賴:
pip install -r requirements.txt。 - 配置環(huán)境變量:打開
config/config.yaml配置ASR、LLM等相關(guān)配置,下載SenseVoiceSmall到目錄models/SenseVoiceSmall,并獲取deepseek的api_key。 - 啟動(dòng)后端服務(wù):
cd server,運(yùn)行python server.py(可選)。 - 啟動(dòng)主程序:運(yùn)行
python main.py,系統(tǒng)會(huì)等待語音輸入,用戶即可開始使用百聆進(jìn)行語音對(duì)話。
百聆的產(chǎn)品價(jià)格
百聆是一個(gè)完全開源的項(xiàng)目,因此它是免費(fèi)的。用戶可以下載、使用和修改源代碼。
百聆的常見問題
百聆的運(yùn)行需要多大的內(nèi)存? 百聆的設(shè)計(jì)目標(biāo)是低配置運(yùn)行,具體內(nèi)存需求取決于所選擇的模型和配置,但一般情況下,較低的配置也能流暢運(yùn)行。
百聆支持哪些語言? 目前百聆主要支持中文,未來可能會(huì)支持更多語言,這取決于社區(qū)的貢獻(xiàn)。
如果在使用過程中遇到問題,如何尋求幫助? 百聆是一個(gè)開源項(xiàng)目,用戶可以在項(xiàng)目的GitHub頁面上提交問題或?qū)で髱椭部梢约尤肷鐓^(qū)交流,與其他用戶一起解決問題。
百聆官網(wǎng)入口網(wǎng)址
https://github.com/wwbin2017/bailing
OpenI小編發(fā)現(xiàn)百聆網(wǎng)站非常受用戶歡迎,請(qǐng)?jiān)L問百聆網(wǎng)址入口試用。
數(shù)據(jù)評(píng)估
本站OpenI提供的百聆都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對(duì)于該外部鏈接的指向,不由OpenI實(shí)際控制,在2025年 3月 17日 下午7:57收錄時(shí),該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。



粵公網(wǎng)安備 44011502001135號(hào)