胡瀚是計算機視覺領域通用架構Swim Transformer的核心作者之一。
騰訊混元大模型迎來新負責人:前微軟亞洲研究院首席研究員胡瀚
本文總結了AI科技評論獨家報道:前微軟亞洲研究院視覺計算組首席研究員胡瀚加入騰訊,接替離職的劉威,負責多模態大模型研發工作。
胡瀚的學術背景和職業經歷
胡瀚擁有清華大學本科和博士學位,師從周杰教授,博士論文獲2016年中國人工智能學會優秀博士論文獎。他曾在賓夕法尼亞大學GRASP實驗室進行訪問研究,后加入百度深度學習研究所(IDL),擔任Tech Leader。2016年加入微軟亞洲研究院視覺計算組,擔任首席研究員。
Swin Transformer及其影響
胡瀚作為核心作者參與了具有里程碑意義的論文《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的創作。該論文解決了當時業界關于Transformer和卷積神經網絡的爭論,Swin Transformer的性能優于當時的許多主流網絡,成為計算機視覺領域通用的backbone,并獲得了ICCV最佳論文獎(馬爾獎)。
胡瀚加入騰訊的意義
胡瀚加入騰訊,接替了離職的劉威,負責混元大模型的多模態研發工作。這表明騰訊在多模態大模型領域持續投入,并希望借助胡瀚在計算機視覺領域的深厚積累,進一步提升混元大模型的能力。
劉威的貢獻和離職
劉威曾是騰訊AI Lab的負責人之一,在計算機視覺和多模態領域取得了顯著成就,參與了騰訊混元大模型的早期研發工作,包括CV基礎大模型、多模態理解大模型、文生圖、文生視頻大模型等。其離職消息在十一月下旬被媒體報道。
騰訊混元大模型的最新進展
騰訊混元大模型已陸續推出文生文、文生圖、3D生成等能力,并在12月3日開源了130億參數量的文生視頻能力,被認為是混元系列大模型當前的最后一塊重要拼圖,標志著騰訊在多模態大模型領域取得了新的進展。
總而言之,胡瀚的加入為騰訊混元大模型注入了新的活力,預示著騰訊在AI領域,特別是多模態大模型領域的持續發力。 胡瀚在Swin Transformer上的突出貢獻以及他在計算機視覺領域的深厚積累,將助力騰訊混元大模型在未來取得更大的突破。
聯系作者
文章來源:大數據文摘
作者微信:
作者簡介:普及數據思維,傳播數據文化