他們構成中國強化學習研究的半壁江山。
原標題:UCL強化學習派:汪軍與他的學生們
文章來源:AI科技評論
內容字數:28812字
汪軍及其學生:中國強化學習的半壁江山
本文講述了汪軍教授及其學生們在中國強化學習領域做出的杰出貢獻,以及他們如何推動強化學習在中國的本土化發展。
從推薦系統到強化學習
汪軍教授的學術生涯始于推薦系統和信息檢索領域。他博士期間的研究工作,特別是將經濟學理論引入信息檢索領域的“Portfolio Theory of Information Retrieval”,獲得了SIGIR時間檢驗獎提名。在研究廣告競價機制的過程中,他意識到其本質是強化學習,為其后轉向強化學習領域奠定了基礎。
UCL強化學習開拓者
在倫敦大學學院(UCL),汪軍與David Silver等強化學習專家合作,將強化學習應用于計算廣告領域。他與學生創辦了AI廣告公司MediaGamma,將強化學習算法首次應用于廣告實時交易的商業化應用,為后續研究提供了寶貴的經驗和數據。
培養人才,推動領域發展
汪軍教授注重學生培養,鼓勵學生探索,并引導他們選擇有潛力的研究方向。他的學生們,如張偉楠、溫穎、楊耀東等,在多智能體強化學習、深度強化學習以及強化學習與大模型的結合等方面取得了顯著成果。他們中的許多人已成為國內強化學習領域的領軍人物。
RL China:強化學習的本土化推廣
為了推動中國強化學習的發展,汪軍教授發起成立了華人強化學習社區RL China,通過組織線上線下課程、研討會等活動,培養人才,促進學術交流與合作,為中國強化學習的蓬勃發展起到了至關重要的作用。張偉楠編寫的《動手學強化學習》也成為國內強化學習領域的暢銷教材。
大模型與具身智能:探索AGI的道路
近年來,汪軍及其學生們積極探索強化學習與大模型、具身智能的結合,致力于開發通用決策模型,并取得了一定的進展。他們嘗試將強化學習應用于機器人控制、芯片設計優化等實際場景,為通往AGI的道路上做出了貢獻。
總結:通往AGI的最后一公里
汪軍教授及其學生們在中國強化學習領域取得了令人矚目的成就,他們不僅在學術研究上取得突破,還在推動技術落地、培養人才方面做出了重要貢獻。他們的工作為中國強化學習的發展奠定了堅實的基礎,并為通往AGI的道路上貢獻了力量。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。