標簽:任務
導航、采礦、建造,北大這個新智能體把《我的世界》玩透了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
新擴散模型OmniGen一統圖像生成,架構還高度簡化、易用
機器之心發布 機器之心編輯部大型語言模型(LLM)的出現統一了語言生成任務,并徹底改變了人機交互。然而,在圖像生成領域,能夠在單一框架內處理各種任務的...
強化學習訓練一兩個小時,100%自主完成任務:機器人ChatGPT時刻真來了?
機器之心報道 編輯:Panda、佳琪把平均成功率從 50% 拉到了 100%。最近,AI 的進步有目共睹,現在這些進步已經開始傳遞到機器人領域。強大的 AI 技術也能幫助...
超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定義邊界框回歸任務
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
一個模型走天下!智源提出全新擴散架構OmniGen,AI生圖進入「一鍵生成」時代
新智元報道編輯:編輯部 HYZ 【新智元導讀】LLM統一了語言生成任務,圖像生成可以嗎?就在剛剛,智源推出了全新擴散模型架構OmniGen,單個模型就能生成圖像,...
超越Transformer,全面升級!MIT等華人團隊發布通用時序TimeMixer++架構,8項任務全面領先
新智元報道編輯:LRST 【新智元導讀】TimeMixer++是一個創新的時間序列分析模型,通過多尺度和多分辨率的方法在多個任務上超越了現有模型,展示了時間序列分...
突破時間序列組合推理難題!南加大發布一站式多步推理框架TS-Reasoner
新智元報道編輯:LRST 【新智元導讀】TS-Reasoner是一個創新的多步推理框架,結合了大型語言模型的上下文學習和推理能力,通過程序化多步推理、模塊化設計、...
多模態大模型: 盤點&Highlights part1——從BLIP到LLaVA
講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀Hi大家好,我叫延捷,...
通用人工智能大型社會模擬器發布,朱松純:判斷AGI的關鍵在于兩大“完備性”
作者 | 華衛 近日,由北京大學武漢人工智能研究院與武漢東湖高新區國家智能社會治理實驗綜合基地共同打造的“大型社會模擬器 1.0”正式發布。 據介紹,大型社...
田淵棟團隊新作祭出Agent-as-a-Judge!AI智能體自我審判,成本暴跌97%
新智元報道編輯:桃子 【新智元導讀】AI評估AI可靠嗎?來自Meta、KAUST團隊的最新研究中,提出了Agent-as-a-Judge框架,證實了智能體系統能夠以類人的方式評...
谷歌版賈維斯即將問世,最強Gemini 2.0加持!AI自主操控電腦時代來臨
新智元報道編輯:桃子 LRS 【新智元導讀】科幻中的賈維斯,已經離我們不遠了。Claude 3.5接管人類電腦掀起了人機交互全新范式,爆料稱谷歌同類Project Jarvis...
UCL博士生創業一年,造出最強AI「ML工程師」,OpenAI蓋戳認證
機器之心原創 作者:微胖重要的事說三遍:Agent 框架很重要。一、被忽略的「Agent 框架」 OpenAI 最近又有了新動作,這次他們的野心更大了。 鑒于大型語言模...
Claude接管人類電腦編程,程序員沸騰!OpenAI反擊,智能體大戰一觸即發
新智元報道編輯:桃子 好困 【新智元導讀】AI接管人類電腦,未來已來!Claude自主操控電腦,從編程到科研無所不能,代表著萬能API。另一邊,OpenAI內部加急研...
RNN回歸!Bengio新作大道至簡與Transformer一較高下
新智元報道編輯:alan 【新智元導讀】近日,深度學習三巨頭之一的Yoshua Bengio,帶領團隊推出了全新的RNN架構,以大道至簡的思想與Transformer一較高下。在T...
最大開源機器人數據集!DeepMind聯手21家機構,整合60個數據集,發布Open X-Embodiment,具身智能時代來臨
作者:十九 編輯:李寶珠 谷歌 DeepMind 聯手斯坦福大學、上海交通大學、英偉達、紐約大學、哥倫比亞大學等 21 家國際知名機構,整合 60 個現有的機器人數據...