標簽:編碼器

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現...

超GPT-4o,1240億參數!最強開源多模態(tài)模型?Pixtral Large!

大會預告12月5-6日,智猩猩共同主辦的2024中國生成式AI大會(上海站)將舉辦。北大(臨港)大模型對齊中心執(zhí)行主任徐驊,騰訊優(yōu)圖實驗室天衍研究中心負責人吳...
閱讀原文

多模態(tài)競技場對標90B Llama 3.2!Pixtral 12B技術報告全公開

新智元報道編輯:alan 【新智元導讀】以開源極客之姿殺入江湖的Mistral AI,在9月份甩出了自家的首款多模態(tài)大模型Pixtral 12B,如今,報告之期已至,技術細節(jié)...
閱讀原文

浙大開源“最懂Excel的GPT”!首次將結構化數據作為模態(tài)訓練,刷榜提升40百分點

明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAI大模型理解復雜表格,能力再次飛升了! 不僅能在不規(guī)則表格中精準找到相關信息,還能直接進行計算。 比如提問: 如果...
閱讀原文

NeurIPS 2024收錄!基于擴散模型編碼器模塊的推理加速丨一作、南開大學博士生李森茂講座預告

最近,文本到圖像的擴散模型取得了顯著的進步。值得注意的是,Stable Diffusion和DeepFloyd-IF是當前開源社區(qū)中最成功的兩個擴散模型。這些模型基于UNet架構...
閱讀原文

謝賽寧新作:表征學習有多重要?一個操作刷新SOTA,DiT訓練速度暴漲18倍

新智元報道編輯:喬楊 【新智元導讀】在NLP領域,研究者們已經充分認識并認可了表征學習的重要性,那么視覺領域的生成模型呢?最近,謝賽寧團隊發(fā)表的一篇研...
閱讀原文

DeepSeek新作Janus:解耦視覺編碼,引領多模態(tài)理解與生成統一新范式

AIxiv專欄是機器之心發(fā)布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術...
閱讀原文

SAM 2.1上新、Lingua代碼庫發(fā)布,一Meta開源工具來襲

機器之心報道 機器之心編輯部????今天,Meta 分享了一系列研究和模型,這些研究和模型支撐 Meta 實現高級機器智能(AMI)目標,同時也致力于開放科學和可復現...
閱讀原文

4090筆記本0.37秒直出大片!英偉達聯手MIT清華祭出Sana架構,速度秒殺FLUX

新智元報道編輯:桃子 好困 【新智元導讀】一臺4090筆記本,秒生1K質量高清圖。英偉達聯合MIT清華團隊提出的Sana架構,得益于核心架構創(chuàng)新,具備了驚人的圖像...
閱讀原文

擴散模型訓練方法一直錯了!謝賽寧:Representation matters

機器之心報道 編輯:Panda、小舟Representation matters. Representation matters. Representation matters.是什么讓紐約大學著名研究者謝賽寧三連呼喊「Repr...
閱讀原文

Meta版Sora無預警來襲!拋棄擴散損失,音視頻生成/畫面編輯全包,92頁論文無保留公開

夢晨 衡宇 發(fā)自 凹非寺量子位 | 公眾號 QbitAI剛剛,Meta搶在OpenAI之前推出自己的Sora——Meta Movie Gen Sora有的它都有,可創(chuàng)建不同寬高比的高清長視頻,支...
閱讀原文

僅用4塊GPU、不到3天訓練出「開源版GPT-4o」,這是國內團隊最新研究

機器之心報道 編輯:小舟、陳陳LLaMA-Omni能夠接收語音指令,同步生成文本和語音響應,響應延遲低至 226ms,低于 GPT-4o 的平均音頻響應延遲 320ms。以 ChatG...
閱讀原文

Mistral多模態(tài)大模型來了!120億參數,原生支持任意大小/數量圖像,公司估值已達420億

明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAIMistral的多模態(tài)大模型來了! Pixtral 12B正式發(fā)布,同時具備語言和視覺處理能力。 它建立在文本模型Nemo 12B基礎上...
閱讀原文

機器人也會系鞋帶了!斯坦福團隊用模仿學習賦予機器人新技能丨已開源

叨樂 發(fā)自 凹非寺量子位 | 公眾號 QbitAI斯坦福年初剛教完機器人炒菜,現在又教機器人系鞋帶! 他們還發(fā)布了全球首個機器人自主系鞋帶演示視頻: 與之前的炒...
閱讀原文

韓國N號房卷土重來,這一次是Deepfake,波及超200所學校

金磊 一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAIDeepfake(深度偽造),再度深陷輿論的風波。 這一次,用這項AI技術犯罪的嚴重程度被網友直呼是“韓國N號房2.0”...
閱讀原文

MSU世界視頻編碼器大賽成績出爐,騰訊包攬全部指標第一名

機器之心發(fā)布 機器之心編輯部今日獲悉,由莫斯科國立大學舉辦的 MSU 世界視頻編碼器大賽結果揭曉。在全部參賽編碼器中,騰訊編碼器包攬所有 15 項指標的全部...
閱讀原文
1235