Stable Vicuna官網(wǎng)
Stability AI發(fā)布的Vicuna,第一個開源RLHF機器人

StableVicuna是什么?
StableVicuna是首個通過人類反饋強化學習(RLHF)訓練的大規(guī)模開源機器人。它是在Vicuna v0 13b的基礎(chǔ)上,經(jīng)過進一步的指令微調(diào)與RLHF訓練而打造的,而Vicuna v0 13b本身就是一個經(jīng)過指令微調(diào)的LLaMA 13b模型。
StableVicuna的性能表現(xiàn):
相關(guān)基準測試表明,與其他同等規(guī)模的開源機器人相比,StableVicuna展現(xiàn)出卓越的整體性能。
StableVicuna的技術(shù)實現(xiàn):
為了實現(xiàn)StableVicuna的強大性能,開發(fā)團隊以Vicuna作為基礎(chǔ)模型,并遵循Steinnon等人與Ouyang等人提出的經(jīng)典三階段RLHF流程。具體來說,基礎(chǔ)Vicuna模型通過監(jiān)督微調(diào)(SFT),并借助三個數(shù)據(jù)集進行進一步的訓練。
Stable Vicuna官方網(wǎng)站入口網(wǎng)址:
Stable Vicuna官網(wǎng):https://chat.lmsys.org/
OpenI小編發(fā)現(xiàn)Stable Vicuna網(wǎng)站非常受用戶歡迎,請訪問Stable Vicuna官網(wǎng)網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的Stable Vicuna都來源于網(wǎng)絡(luò),不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2025年 3月 27日 下午5:51收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進行刪除,OpenI不承擔任何責任。


粵公網(wǎng)安備 44011502001135號