StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一個通過基于人類反饋的強化學習(RLHF)訓練的大規模開源機器人。StableVicuna是Vicuna v0 13b的進一步指令微調和RLHF訓練版本,它是一個指令微調的 LLaMA 130億模型。

數據評估
關于StableVicuna特別聲明
本站OpenI提供的StableVicuna都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 5月 9日 上午11:22收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。
相關導航
暫無評論...