標簽:軌跡
3倍生成速度還降內存成本,超越Medusa2的高效解碼框架終于來了
機器之心報道 編輯:亞鸝高效解碼n -token序列,CLLMs+Jacobi解碼框架。?????? 傳統上,大型語言模型(LLMs)被認為是順序解碼器,逐個解碼每個token。 來自...
加速擴散模型,最快1步生成SOT圖片,字節Hyper-SD開源了
機器之心發布 機器之心編輯部最近,擴散模型(Diffusion Model)在圖像生成領域取得了顯著的進展,為圖像生成和視頻生成任務帶來了前所未有的發展機遇。盡管...
AI重建粒子軌跡,發現新物理學
將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯| 綠蘿 電子學在核物理領域從來都不是一帆風順的。大型強子對撞機作為全球最強大的加速器...
AI 重建粒子軌跡,發現新物理學
將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯| 綠蘿 電子學在核物理領域從來都不是一帆風順的。大型強子對撞機作為全球最強大的加速器...
AI大模型控制紅綠燈,港科大(廣州)智慧交通新成果已開源
LLMLight團隊 投稿量子位 | 公眾號 QbitAI大模型“上路”,干起了交通信號控制(TSC)的活~ 模型名為LightGPT,以排隊及不同區段快要接近信號燈的車輛對路口交...
伯克利團隊發布最新論文!用訓練GPT的方法訓練人形機器人|甲子光年
Scaling law“統一”人形機器人?作者|劉楊楠 編輯|趙健 一臺人形機器人在人行道、混凝土、瀝青、廣場和沙路上“散步”,這不是科幻電影的場景,而是已經發生在...
讓機器人感知你的「Here you are」,清華團隊使用百萬場景打造通用人機交接
機器之心專欄 機器之心編輯部來自清華大學交叉信息研究院的研究者提出了「GenH2R」框架,讓機器人學習通用的基于視覺的人機交接策略(generalizable vision-b...
GPT-4V都搞不明白的未來推理有解法了!來自華科大&上科大
于恩 投稿量子位 | 公眾號 QbitAI多模態大語言模型展現了強大的圖像理解和推理能力。但要讓它們基于當前觀測來對未來事件進行預測推理仍然非常困難。即便是當...
后期狂喜!一張照片絲滑替換視頻主角,動作幅度再大也OK|Meta&新加坡國立大學
豐色 發自 凹非寺量子位 | 公眾號 QbitAI后期狂喜了家人們~現在,只需一張圖片就能替換視頻主角,效果還是如此的絲滑!且看這個叫做“VideoSwap”的新視頻編輯...
谷歌:LLM找不到推理錯誤,但能糾正它
機器之心報道編輯:PandaLLM 找不到推理錯誤,但卻能糾正錯誤!今年,大型語言模型(LLM)成為 AI 領域關注的焦點。LLM 在各種自然語言處理(NLP)任務上取得...
清華微軟「LLM+推理智能體」超越GPT-4!攻克數理難題,斬獲開源界MATH最佳成績
新智元報道編輯:潤【新智元導讀】由清華大學和微軟研究院共同的提出的TORA,結合了LLM的分布推理能力和外部程序的解決問題能力,將開源大模型的推理和數理能...
讓Llama2 直逼 GPT-4!清華最新研究,大幅提升大模型的通用智能體能力!
?大數據文摘受權轉載自夕小瑤科技說作者 | 智商掉了一地、ZenMoore智能體 (agent) 是一種能夠感知環境、做出決策并采取行動的實體。傳統的智能體在專業領域表...
大幅提升大模型的通用智能體能力!清華最新研究,讓Llama2直逼GPT-4?
夕小瑤科技說 原創作者 | 智商掉了一地、ZenMoore智能體 (agent) 是一種能夠感知環境、做出決策并采取行動的實體。傳統的智能體在專業領域表現出色,但在適應...
帶你穿越清明上河圖!DragNUWA驚艷亮相:一拖一拽讓靜圖秒變視頻
新智元報道編輯:Lumina【新智元導讀】微軟提出文本圖像軌跡條件視頻生成模型DragNUWA,支持手繪軌跡驅動圖像動態化,實現復雜運動及場景控制。微軟開發的視...
12