<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

訓練視覺語言模型VLM的經驗

AIGC動態7個月前發布智猩猩GenAI

475 0 0

訓練視覺語言模型VLM的經驗

AIGC動態歡迎閱讀

原標題：訓練視覺語言模型VLM的經驗
關鍵字：數據,知乎,侵權,業務,模型
文章來源：智猩猩GenAI
內容字數：0字

內容摘要：

講座預告11月1日上午10點，南開大學在讀博士李森茂，將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解，歡迎掃名~導讀作者為lym
原文來自知乎，地址：https://zhuanlan.zhihu.com/p/890327005
本文只做學術/技術分享，如有侵權，聯系刪文。如果可以用prompt解決，盡量用prompt解決，因為訓練（精調）的模型往往通用能力會下降，訓練和長期部署成本都比較高，這個成本也包括時間成本。
基于prompt確實不行（情況包括格式輸出不穩定、格式輸出基本不對、任務不完全會、任務完全不會等情況，難度逐漸加大），選擇上SFT微調。
業務場景基本用不到強化學習，強化解決的是最后一公里的問題，可以理解為有兩種非常接近的輸出（這兩種輸出都非常接近目標輸出，此時已經解決了90%的問題），強化學習會對相同的輸入，打壓其中一種不希望的輸出，同時增強另一種更接近目標的希望的輸出（從DPO loss就可以看出）。強化是用來應對細微輸出差異的，并且業務場景優先用DPO，DPO只需要pair對數據，更好構造。PPO的reward model幾乎沒有開源的，需要的數據更多

原文鏈接：訓練視覺語言模型VLM的經驗

聯系作者

文章來源：智猩猩GenAI
作者微信：
作者簡介：

# AIGC動態 # 業務 # 侵權 # 數據 # 模型 # 知乎

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：亚洲国产精品成人精品无码区| 亚洲三级在线视频| 亚洲国产精品高清久久久| 一级毛片aaaaaa视频免费看| 色欲色香天天天综合网站免费| 国产精品免费看香蕉| 亚洲天堂视频在线观看| 理论秋霞在线看免费| 一色屋成人免费精品网站| 国产成人A人亚洲精品无码| a毛片免费在线观看| 国产一区视频在线免费观看| 亚洲精品电影天堂网| 一级有奶水毛片免费看| 国产乱子伦精品免费女| 人妻仑乱A级毛片免费看| 日本免费一区二区三区最新vr| 亚洲第一永久在线观看| 免费一本色道久久一区| 亚洲色图综合网站| 久久免费线看线看| 亚洲午夜国产片在线观看| 欧洲乱码伦视频免费国产| 国产福利免费观看| www一区二区www免费| 亚洲精品成人a在线观看| 亚洲JIZZJIZZ妇女| 女人18毛片水真多免费播放| 亚洲国产精品综合一区在线| 四虎影视在线影院在线观看免费视频 | 免费国产成人高清视频网站 | 亚洲精品自产拍在线观看| 免费的黄色的网站| 久久久亚洲精品国产| 无人在线观看免费高清| 亚洲欧美日韩久久精品| 免费毛片在线视频| 亚洲大码熟女在线观看| 亚洲色WWW成人永久网址| 中文字幕av免费专区| 亚洲精品国产精品乱码在线观看|