標簽:圖像

GTA6預告片播放過億,AI三巨頭也能秒變GTA匪幫

機器之心專欄機器之心編輯部GTA 新出的游戲預告片看了嗎?據說,這個預告片已經破了三項吉尼斯世界紀錄,觀看次數已經破億。但如果告訴你,AI 三巨頭也可以成...
閱讀原文

Google 最強大模型發布,GPT-4 要被反超?

與 GPT-4正面對決昨天深夜,Google 突然發布重磅 AI 殺手锏——Gemini。多模態 Gemini 可以理解、操作和結合不同類型的信息,包括文本、代碼、音頻、圖像和視頻...
閱讀原文

超越GPT-4!谷歌DeepMind重磅發布Gemini,史上最強最通用大模型!

夕小瑤科技說 原創作者 | 王二狗深夜炸彈!就在剛剛,谷歌 DeepMind 重磅推出了傳聞已久的Gemini大模型!號稱是谷歌史上功能最強大、最通用的多模態模型,在...
閱讀原文

Google發布Gemini,超越GPT-4

點擊上方藍字關注我們“ Google 期待已久的 Gemini Pro AI 模型終于在Bard首次亮相,盡管這是一個功能較少的較小版本。此外,Google 還在為 2024 年初推出的更...
閱讀原文

小模型也可以「分割一切」,Meta改進SAM,參數僅為原版5%

機器之心報道編輯:陳萍、蛋醬對于 2023 年的計算機視覺領域來說,「」(Segment Anything Model)是備受關注的一項研究進展。Meta四月份發布的「分割一切模...
閱讀原文

ChatGPT失業危機!微軟Copilot重磅升級,圖文代碼能力暴漲,還免費

不是ChatGPT用不起,而是微軟Copilot更有性價比。作者|香草編輯|李水青智東西12月6日報道,今天凌晨,在旗下AI助手Copilot發布一周年之際,微軟宣布Copilot迎...
閱讀原文

爆料!馬斯克旗下AI公司xAI正計劃融資10億美元…

夕小瑤科技說 原創作者 | 王二狗大家好,我是二狗。馬斯克終究是閑不住??!據外媒最新爆料,馬斯克旗下AI公司xAI正計劃融資10億美元。xAI在向美國證券交易委...
閱讀原文

一張照片,TikTok姐就都能跳舞了

機器之心報道編輯:杜偉、小舟動畫視頻生成這幾天火了,這次 NUS、字節的新框架不僅效果自然流暢,還在視頻保真度方面比其他方法強了一大截。前幾日,阿里研...
閱讀原文

“離譜的AI擴圖”火了!張張那叫一個出其不意

金磊 西風 發自 凹非寺量子位 | 公眾號 QbitAI家人們,真的是要被抖音AI擴圖給笑死了——主打一個看完讓人“意想不到”、“一肚子氣”~例如一對恩愛情侶的照片在AI...
閱讀原文

通用視覺推理顯現,UC伯克利煉出單一純CV大模型,三位資深學者參與

機器之心報道機器之心編輯部僅靠視覺(像素)模型能走多遠?UC 伯克利、約翰霍普金斯大學的新論文探討了這一問題,并展示了大型視覺模型(LVM)在多種 CV 任...
閱讀原文

計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現AGI火花

新智元報道編輯:編輯部【新智元導讀】UC伯克利的CV三巨頭推出首個無自然語言的純視覺大模型,第一次證明純CV模型也是可擴展的。更令人震驚的是,LVM竟然也能...
閱讀原文

橫掃13個視覺語言任務!哈工深發布多模態大模型「九天」,性能直升5%

新智元報道編輯:LRS【新智元導讀】哈工深發布全新多模態大語言模型九天(JiuTian-LION),融合細粒度空間感知和高層語義視覺知識,在13個評測任務上實現了so...
閱讀原文

突破分辨率極限,字節聯合中科大提出多模態文檔大模型

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI現在連文檔都有大模型了,還是高分辨率、多模態的那種!不僅能準確識別出圖像里的信息,還能結合用戶需求調用自己...
閱讀原文

再見,平面設計師?COLE 結合多個人工智能,按需生成可編輯設計

點擊上方藍字關注我們?“ COLE是一款潛力巨大的平面設計工具,能夠通過輸入文本提示生成高質量設計,具有可編輯文本和圖像對象。雖然目前還不是成熟產品,但已...
閱讀原文

AI視覺字謎爆火!夢露轉180°秒變愛因斯坦,英偉達高級AI科學家:近期最酷的擴散模型

克雷西 蕭簫 發自 凹非寺量子位 | 公眾號 QbitAIAI畫的瑪麗蓮·夢露,倒轉180°后,竟然變成了愛因斯坦?!這是最近在社交媒體上爆火的擴散模型視錯覺畫,隨便...
閱讀原文
1353637383948