獨家丨前微軟亞研院視覺專家胡瀚加入騰訊,負責混元多模態(tài)大模型
胡瀚是計算機視覺領域通用架構Swim Transformer的核心作者之一。
原標題:獨家丨前微軟亞研院視覺專家胡瀚加入騰訊,負責混元多模態(tài)大模型
文章來源:AI科技評論
內容字數:3064字
胡瀚加入騰訊,負責多模態(tài)大模型研發(fā)
本文報道了計算機視覺領域專家胡瀚加入騰訊的消息,并詳細介紹了他的學術背景、職業(yè)經歷以及在Swin Transformer項目中的重要貢獻。胡瀚接替離職的劉威,負責騰訊多模態(tài)大模型的研發(fā)工作,這標志著騰訊在該領域發(fā)展的新階段。
胡瀚的學術與職業(yè)生涯
胡瀚擁有清華大學本科和博士學位,師從周杰教授,博士論文獲得2016年中國人工智能學會優(yōu)秀博士論文獎。他曾在賓夕法尼亞大學GRASP實驗室進行訪問研究,后加入百度深度學習研究所擔任Tech Leader,并在2016年加入微軟亞洲研究院視覺計算組,擔任首席研究員。
Swin Transformer的突破性貢獻
胡瀚作為Swin Transformer論文的核心作者之一,對計算機視覺領域做出了重大貢獻。Swin Transformer憑借其優(yōu)異的性能,超越了當時的主流網絡架構,成為計算機視覺領域的通用backbone,并獲得ICCV最佳論文獎。該論文解決了當時業(yè)界關于Transformer與卷積網絡孰優(yōu)孰劣的爭論焦點。
接替劉威,負責騰訊多模態(tài)大模型研發(fā)
胡瀚加入騰訊,接替了離職的劉威,負責騰訊多模態(tài)大模型的研發(fā)工作。劉威曾是騰訊AI Lab的重要成員,在CV基礎大模型、多模態(tài)理解大模型以及文生圖、文生視頻等方面都有突出貢獻,并獲得諸多榮譽。
騰訊多模態(tài)大模型的進展
騰訊在多模態(tài)大模型研發(fā)方面取得了顯著進展,近期開源了參數量達130億的混元大模型的文生視頻能力,此前已陸續(xù)推出文生文、文生圖、3D生成等能力,這標志著騰訊在多模態(tài)大模型領域邁出了堅實的一步。
總結
胡瀚的加入為騰訊多模態(tài)大模型的研發(fā)注入了新的活力。憑借其在計算機視覺領域的深厚積累和Swin Transformer的成功經驗,他將帶領團隊進一步推動騰訊在人工智能領域的發(fā)展,為用戶帶來更先進、更智能的產品和服務。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。