AIGC動態歡迎閱讀
原標題:首個o1復現開源RL框架OpenR來了,UCL、上交等高校聯合團隊發布
關鍵字:模型,步驟,數據,報告,過程
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.comOpenR 研究團隊成員包括:汪軍教授,倫敦大學學院(UCL)計算機系教授,阿蘭?圖靈研究所 Turing Fellow,其指導的 UCL 一年級博士生宋研。利物浦大學助理教授方蒙。上海交通大學 Apex 和多智能體實驗室張偉楠教授(上海交通大學計算機系教授、博士生導師、副系主任),溫穎副教授(上海交通大學約翰?霍普克羅夫特計算機科學中心副教授)以及其指導的博士生萬梓煜、溫睦寧、朱家琛。張偉楠教授和溫穎副教授博士期間就讀于 UCL,指導教師為汪軍教授。香港科技大學(廣州)創校校長,倪明選(Lionel M. Ni),香港工程科學院院士,香港科技大學(廣州)講席教授。陳雷,香港科技大學(廣州)信息樞紐院長,講席教授。香港科技大學(廣州)一年級博士生劉安杰、龔子欽
原文鏈接:首個o1復現開源RL框架OpenR來了,UCL、上交等高校聯合團隊發布
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...