標簽:文本
不到60秒就能生成3D「手辦」,Meta發力3D生成,ChatGPT時刻要來了嗎?
機器之心報道 編輯:陳萍、張倩??3D 生成,一直在等待它的「ChatGPT時刻」。?一直以來,創作 3D 內容是設計和開發視頻游戲、增強現實、虛擬現實以及影視特效...
60秒直出3D內容,紋理逼真!Meta最新3D Gen模型實現60倍速生成
新智元報道編輯:喬楊 好困 【新智元導讀】Meta的GenAI團隊在最新研究中介紹了Meta 3D Gen模型:可以在不到1分鐘的時間內從文本直接端到端生成3D資產。在圖像...
ECCV 2024揭榜,錄用率或創新低!2395篇論文中選,網友曬出成績單
新智元報道編輯:桃子 好困 【新智元導讀】兩年一屆的ECCV錄用結果終于揭曉了!剛剛,ECCV組委會公布了錄用論文名單,共有2395篇論文被錄用。ECCV 2024錄用結...
CVPR'24:文生圖提示詞自動優化,還發現三個小竅門,人大度小滿等機構出品
PAE團隊 投稿至 凹非寺量子位 | 公眾號 QbitAI文生圖也有自己的prompt優化工具了。 我們都知道,大模型輸出的質量,很大程度上依賴于輸入的prompt。尤其在文...
按需搭配一鍵疊穿,效果拿下新SOTA!中山大學&字節智創數字人團隊提出虛擬試穿新框架
MMTryon團隊 投稿量子位 | 公眾號 QbitAI多件衣服按指定穿法一鍵虛擬試穿! 中山大學&字節智創數字人團隊提出了一個名為MMTryon的虛擬試穿框架,可以通過...
亞馬遜云創新「神經稀疏檢索」:僅需要文本匹配就能實現語義搜索
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
通用多模態人工智能:架構、挑戰和機遇綜述
來源:專知 多模態模型被認為是未來人工智能進步的關鍵組成部分。由于基礎模型在自然語言處理 (NLP) 和視覺領域的成功,這一領域正迅速發展,并涌現出大量新...
將圖像自動文本化,圖像描述質量更高、更準確了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
超越擴散模型!自回歸新范式僅需2.9秒就生成高質量圖像,中科大哈工大度小滿出品
STAR團隊 投稿自 凹非寺量子位 | 公眾號 QbitAI超越擴散模型!自回歸范式在圖像生成領域再次被驗證—— 中科大、哈工大、度小滿等機構提出通用文生圖模型STAR。...
Claude 3.5 發布!性能超越GPT-4o和Claude 3 Opus!
夕小瑤科技說 原創作者 | 醒醒Claude大模型又雙叒叕更新升級了!剛剛,OpenAI最強對手Anthropic官宣了Claude 3.5 系列的第一個大模型——Claude 3.5 Sonnet。 ...
Sora 團隊負責人 Aditya Ramesh 對話謝賽寧丨壓縮一切!視覺與語言模態的融合?
大數據文摘受權轉載自智源社區 2024 年 6 月 14 日,一年一度的智源大會又迎來重磅嘉賓。 當紅視頻生成大模型「Sora」團隊的負責人Aditya Ramesh在2024智源大...
字節豆包、武大提出 CAL:通過視覺相關的 token 增強多模態對齊效果
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Scaling Law觸礁「數據墻」?Epoch AI發文預測LLM到2028年耗盡所有文本數據
新智元報道編輯:喬楊 【新智元導讀】訓練數據的數量和質量,對LLM性能的重要性已經是不言自明的事實。然而,Epoch AI近期的一篇論文卻給正在瘋狂擴展的AI模...
剛剛!Stable Diffusion 3 重磅開源,超全圖像生成必備訓練數據集、教程匯總
Stability AI 已經正式開源 Stable Diffusion 3(簡稱 SD3)!SD3 是一個圖像生成模型,只要給定一段描述性的文字,就能夠創造出與之匹配的視覺作品。下圖就...
GPT-4o更容易越獄?北航&南洋理工上萬次測試給出詳細分析
北航&南洋理工聯合團隊投稿量子位 | 公眾號 QbitAIGPT-4o,比上一代更容易被越獄攻擊了? 來自北航和南洋理工的研究人員,通過上萬次的API查詢,對GPT-4o...