標簽:視覺
追憶商湯科技湯曉鷗:告別一個有趣的靈魂|甲子光年
湯曉鷗教授,一路走好。作者|「甲子光年」內容團隊???“我不是在最好的時光遇見了你們,而是遇見了你們,我才有了這段最好的時光。”在今年7月舉辦的2023世界...
悼念!商湯創始人湯曉鷗逝世,享年55歲
金磊 發自 凹非寺量子位 | 公眾號 QbitAI據多方消息證實,商湯科技創始人、香港中文大學教授湯曉鷗,在睡夢中不幸離世,享年55歲。有商湯人士稱:你真的不知...
哀悼 !中國計算機視覺領軍者、商湯創始人湯曉鷗去世
作者丨王悅編輯丨陳彩嫻12 月 16 日中午,AI科技評論獲悉:上海人工智能實驗室主任、商湯科技創始人、香港中文大學信息工程學系教授湯曉鷗去世。經多位獨立信...
LLM生成3D場景,無限延伸!斯坦福華人提出3D動畫生成框架,一句話一幅圖創造無限3D世界
新智元報道編輯:alan 潤【新智元導讀】近日,斯坦福的華人研究人員提出全新視頻生成框架——WonderJourney,一句話或者一張圖,即可自動生成一系列3D場景的連...
當GPT-4V充當機器人大腦,可能你都沒AI會規劃
機器之心專欄機器之心編輯部來自清華大學交叉信息研究院的研究者提出了「ViLa」(全稱Robotic Vision-Language Planning)算法,其能在非常復雜的環境中控制...
一套參數,狂攬160個SOTA!廈大等重磅開源「視覺感知基礎模型」APE
新智元報道編輯:LRS 好困【新智元導讀】由廈門大學等機構提出的全新視覺感知基礎模型APE,只需一個模型外加一套參數,就能在160個測試集上取得當前SOTA或極...
梅卡曼德聯合創始人付翱:AI+3D開啟更廣闊的智能制造時代|甲子引力
3D技術與人工智能的結合真正實現從1到100的跨越。2023年11月30日-12月1日,中國科技產業智庫「甲子光年」主辦的「致追風趕月的你」2023甲子引力年終盛典在北...
首個精通3D任務的具身通才智能體:感知、推理、規劃、行動統統拿下
機器之心專欄機器之心編輯部想要邁向通用人工智能,必須要構建一個能夠理解人類生活的真實世界,并掌握豐富技能的具身通用智能體。今年以來,以 GPT-4 (V)[1]...
傳字節月底推生成式AI開發平臺;馬斯克Grok一周左右向X訂閱用戶開放;王慧文入股大模型AI創企丨AIGC大事日報
12/04全球AIGC產業要聞1、傳字節月底推出AI聊天機器人開發平臺2、王慧文入股袁進輝旗下新AI創企3、馬斯克Grok一周左右向X訂閱用戶開放4、傳谷歌Gemini推遲至...
R-CNN作者Ross Girshick離職,何愷明、謝賽寧回歸學界,Meta CV走出了多少大神
機器之心報道編輯:杜偉、陳萍Yann LeCun 表示:「人才離開 FAIR 是我們的損失,但自己仍為他們感到高興」。FAIR 又一位大佬級研究科學家「出走了」,這次是 ...
通用視覺推理顯現,UC伯克利煉出單一純CV大模型,三位資深學者參與
機器之心報道機器之心編輯部僅靠視覺(像素)模型能走多遠?UC 伯克利、約翰霍普金斯大學的新論文探討了這一問題,并展示了大型視覺模型(LVM)在多種 CV 任...
計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現AGI火花
新智元報道編輯:編輯部【新智元導讀】UC伯克利的CV三巨頭推出首個無自然語言的純視覺大模型,第一次證明純CV模型也是可擴展的。更令人震驚的是,LVM竟然也能...
橫掃13個視覺語言任務!哈工深發布多模態大模型「九天」,性能直升5%
新智元報道編輯:LRS【新智元導讀】哈工深發布全新多模態大語言模型九天(JiuTian-LION),融合細粒度空間感知和高層語義視覺知識,在13個評測任務上實現了so...
北大最新多模態大模型開源:在混合數據集上訓練,無需修改直接用到圖像視頻任務
一個北大投稿 發送至 凹非寺量子位 | 公眾號 QbitAI訓完130億參數通用視覺語言大模型,只需3天!北大和中山大學團隊又出招了——在最新研究中,研究團隊提出了...
訓練130億大模型僅3天,北大提出Chat-UniVi統一圖片和視頻理解
機器之心專欄機器之心編輯部北京大學和中山大學等機構研究者提出了統一的視覺語言大模型 ——Chat-UniVi。通過構建圖片和視頻統一表征,該框架使得一個 LLM 能...