AI訓(xùn)練模型
StableVicuna
StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個(gè)通過基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)訓(xùn)練的大規(guī)模開源機(jī)器人。StableVicuna是Vicuna v0 13b的進(jìn)一步指令微調(diào)和RLHF訓(xùn)練版本,它是一個(gè)指令微調(diào)的 LLaMA 130億模型。

數(shù)據(jù)統(tǒng)計(jì)
數(shù)據(jù)評(píng)估
關(guān)于StableVicuna特別聲明
本站OpenI提供的StableVicuna都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對(duì)于該外部鏈接的指向,不由OpenI實(shí)際控制,在2023年 5月 9日 上午11:22收錄時(shí),該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。
相關(guān)導(dǎo)航
暫無評(píng)論...