標簽:圖像

超低訓練成本文生圖模型PixArt來了,效果媲美MJ,只需SD 10%訓練時間

機器之心專欄機器之心編輯部訓練一個媲美 MJ 的文生圖模型,26K 美元就能實現了。當前,最先進的文本到圖像(T2I)模型需要大量的訓練成本(例如,數百萬個 G...
閱讀原文

谷歌視覺語言模型PaLI-3問世,參數僅5B,更小、更快、更強

機器之心報道編輯:杜偉、陳萍在多模態(視覺語言)大模型領域,拼參數贏性能的同時,追求參數更小、速度更快、性能更強是另一條研究路徑。在大模型時代,視...
閱讀原文

清華團隊攻破GPT-4V、谷歌Bard等模型,商用多模態大模型也脆弱?

機器之心專欄機器之心編輯部GPT-4 近日開放了視覺模態(GPT-4V)。以 GPT-4V、谷歌 Bard 為代表的多模態大語言模型 (Multimodal Large Language Models, MLLM...
閱讀原文

谷歌重磅發布 PaLI-3,四兩撥千斤!

夕小瑤科技說 原創作者 | 智商掉了一地、ZenMoore視覺語言模型(VLM)的參數規模已經擴展到數百億,甚至數千億,這使得其性能持續提升。然而,小規模模型仍然...
閱讀原文

GPT-4V被曝離譜bug:突然執行神秘代碼,空白圖片讀出打折信息,網友們都看呆了

豐色 明敏 發自 凹非寺量子位 | 公眾號 QbitAIGPT-4V出現驚天bug?!原本只是讓它分析一張圖片,結果它直接犯了致命安全問題,把聊天記錄都給抖落出來了。只...
閱讀原文

千萬人圍觀「燒焦嬰兒」圖片!伯克利教授辟謠:AI圖片檢測器無用

新智元報道編輯:桃子 潤【新智元導讀】AI無法打敗AI,不是沒有道理。近來,上千萬人圍觀的嬰兒死亡照片,AI檢測工具竟無法給出一致答案。AI圖片檢測器又被沖...
閱讀原文

谷歌版AI繪畫搜索框里直接玩!基于Imagen打造,網友:DALL-E替代品來了

豐色 發自 凹非寺量子位 | 公眾號 QbitAI谷歌自家的“DALL-E/Midjourney”終于上線了。今天,谷歌給自家搜索來了個大更新:只需在搜索框中輸入提示詞,就能直接...
閱讀原文

AI搞定谷歌驗證碼,最新多模態大模型比GPT-4V空間理解更準確 | 蘋果AI/ML團隊

Michael 投稿自 凹非寺量子位 | 公眾號 QbitAI谷歌人機驗證已經攔不住AI了!最新多模態大模型,能輕松找到圖中所有交通信號燈,還準確圈出了具體位置。表現直...
閱讀原文

Adobe新版AI繪畫炸場,2k分辨率在線就能玩,網友:效果比DALL·E 3更強

蕭簫 發自 凹非寺量子位 | 公眾號 QbitAIFirefly新版文生圖工具,直接炸場Adobe春晚!在一年一度的MAX大會上,Adobe推出了一系列新功能。其中最受矚目的,就...
閱讀原文

挑戰GPT-4V,浙大校友推出開源版多模態大模型,獲GitHub 6k+星標

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIGPT-4的視覺能力還沒全量放開測試,開源對手就隆重登場了。浙大竺院的一位校友,與微軟研究院等機構合作推出了新版...
閱讀原文

在PS里一秒生成圖像素材!Adobe甩出三大AI模型,100多項AI能力炸場

Adobe的逆天黑科技,讓設計師搭上AI順風車。編譯|程茜編輯|李水青智東西10月11日消息,今天凌晨,全球最大設計軟件龍頭Adobe甩出Adobe Firefly創意生成式AI模...
閱讀原文

PS+AI生圖一步完成,效果驚人!Adobe Firefly 2重磅更新:模型全面升級,矢量圖完美支持

新智元報道編輯:潤 貝果【新智元導讀】Adobe的AIGC生圖平臺Firefly最近升級為Firefly 2,提升了圖像質量、引入了矢量圖生成功能,并增加了多項新功能,極大...
閱讀原文

清華全球首顆片上學習憶阻器存算一體芯片,成果登上Science

機器之心報道編輯:杜偉對于攻克「卡脖子」關鍵核心技術,這類憶阻器存算一體芯片具有積極的意義。10 月 9 日,清華大學官微報道了該校研制全球首顆支持片上...
閱讀原文

Adobe要打造AI創意帝國!甩出三大模型、百余項AI更新

Adobe的逆天黑科技,讓設計師搭上AI順風車。編譯|程茜編輯|李水青智東西10月11日消息,今天凌晨,全球最大設計軟件龍頭Adobe甩出Adobe Firefly創意生成式AI模...
閱讀原文

長了眼睛和嘴,ChatGPT 開始入侵物理世界

向著「賈維斯」堅定前行。作者 | 連冉編輯| 靖宇OpenAI,又悄咪咪地放大招了。當地時間 9 月 25 日,OpenAI 在官網更新博客,宣布 ChatGPT 已經具備看、聽、...
閱讀原文
1414243444548