獨家丨前微軟亞研院視覺專家胡瀚加入騰訊，負責混元多模態大模型

AIGC動態10個月前發布 AI科技評論

842 0 0

胡瀚是計算機視覺領域通用架構Swim Transformer的核心作者之一。

原標題：獨家丨前微軟亞研院視覺專家胡瀚加入騰訊，負責混元多模態大模型
文章來源：AI科技評論
內容字數：3064字

胡瀚加入騰訊，負責多模態大模型研發

本文報道了計算機視覺領域專家胡瀚加入騰訊的消息，并詳細介紹了他的學術背景、職業經歷以及在Swin Transformer項目中的重要貢獻。胡瀚接替離職的劉威，負責騰訊多模態大模型的研發工作，這標志著騰訊在該領域發展的新階段。

胡瀚的學術與職業生涯
胡瀚擁有清華大學本科和博士學位，師從周杰教授，博士論文獲得2016年中國人工智能學會優秀博士論文獎。他曾在賓夕法尼亞大學GRASP實驗室進行訪問研究，后加入百度深度學習研究所擔任Tech Leader，并在2016年加入微軟亞洲研究院視覺計算組，擔任首席研究員。
Swin Transformer的突破性貢獻
胡瀚作為Swin Transformer論文的核心作者之一，對計算機視覺領域做出了重大貢獻。Swin Transformer憑借其優異的性能，超越了當時的主流網絡架構，成為計算機視覺領域的通用backbone，并獲得ICCV最佳論文獎。該論文解決了當時業界關于Transformer與卷積網絡孰優孰劣的爭論焦點。
接替劉威，負責騰訊多模態大模型研發
胡瀚加入騰訊，接替了離職的劉威，負責騰訊多模態大模型的研發工作。劉威曾是騰訊AI Lab的重要成員，在CV基礎大模型、多模態理解大模型以及文生圖、文生視頻等方面都有突出貢獻，并獲得諸多榮譽。
騰訊多模態大模型的進展
騰訊在多模態大模型研發方面取得了顯著進展，近期開源了參數量達130億的混元大模型的文生視頻能力，此前已陸續推出文生文、文生圖、3D生成等能力，這標志著騰訊在多模態大模型領域邁出了堅實的一步。
總結
胡瀚的加入為騰訊多模態大模型的研發注入了新的活力。憑借其在計算機視覺領域的深厚積累和Swin Transformer的成功經驗，他將帶領團隊進一步推動騰訊在人工智能領域的發展，為用戶帶來更先進、更智能的產品和服務。