標簽:策略

在對齊 AI 時,為什么在線方法總是優于離線方法?

機器之心報道 編輯:Panda W在線和離線對齊算法的性能差距根源何在?DeepMind實證剖析出爐在 AI 對齊問題上,在線方法似乎總是優于離線方法,但為什么會這樣...
閱讀原文

阿里安全大模型工程實踐、NVIDIA NIM 推理微服務解析 | 研討會直播預告

5月16日19點,智猩猩將舉辦「企業級大模型工程實踐在線研討會」。阿里巴巴 AI 基礎架構工程師劉彬(花名:慧原)、NVIDIA軟件解決方案架構師吳金鐘兩位技術專...
閱讀原文

告別3D高斯Splatting算法,帶神經補償的頻譜剪枝高斯場SUNDAE開源了

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

瑜伽球上遛「狗」!入選英偉達十大項目之一的Eureka有了新突破

機器之心報道 編輯:陳萍機器狗在瑜伽球上穩穩當當的行走,平衡力那是相當的好:各種場景都能拿捏,不管是平坦的人行道、還是充滿挑戰的草坪都能 hold 住:甚...
閱讀原文

加州理工華人用AI顛覆數學證明!提速5倍震驚陶哲軒,80%數學步驟全自動化

新智元報道編輯:編輯部 【新智元導讀】讓陶哲軒大神贊不絕口的形式化研究神器Lean,運行LLM的推理卻有個bug。最近,加州理工團隊解決了這個bug,把80%以上的...
閱讀原文

DeepMind具身智能“足球員”登Science Robotics?封面

大數據文摘受權轉載自機器人大講堂 近日,Google DeepMind發表了一項突破性的研究成果,該公司利用深度強化學習方法,成功訓練出了一個能夠在簡化版1v1足球比...
閱讀原文

Science Robotics封面!DeepMind強化學習打造超一流機器人球員

新智元報道編輯:wewe 【新智元導讀】雙足機器人運動技能突破!谷歌DeepMind創新深度強化學習框架,賦能仿人機器人全身控制,征戰足球賽場。機器人展現驚人動...
閱讀原文

XAI有什么用?探索LLM時代利用可解釋性的10種策略

機器之心專欄 機器之心編輯部你是否也好奇,在大模型時代,可解釋性人工智能技術(XAI)有怎樣的使用價值?近日,來自佐治亞大學、新澤西理工學院、弗吉尼亞...
閱讀原文

港大張清鵬團隊提出個性化癌癥治療新思路:用 AI 控制癌細胞進化過程

現代癌癥治療里耐藥性的發展常常是導致治療失敗和腫瘤進展的原因,每個患者的耐藥情況與腫瘤特征更是具有高度個體化的特征。 為了解決傳統間歇性雄激素剝奪療...
閱讀原文

斯坦福團隊新作:喊話就能指導機器人,任務成功率暴增,網友:特斯拉搞快點

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI斯坦福的ALOHA家務機器人團隊,發布了最新研究成果—— 項目名為Yell At Your Robot(簡稱YAY),有了它,機器人的“...
閱讀原文

今日arXiv最熱大模型論文:學提出用于大模型生成的動態溫度采樣法,簡單有效!

夕小瑤科技說 原創作者 | 松果引言:溫度采樣在大型語言模型中的作用與局限在自然語言處理(NLP)的領域,大語言模型(LLMs)已經在各種下游語言任務中展現出...
閱讀原文

超人類平均水平!伯克利雙足機器人2分34秒刷新紀錄,還能跳1.4遠

大數據文摘授權轉載自機器人大講堂 近日,一則關于雙足機器人創造400米新紀錄的消息刷爆了科技圈。只見這個名叫Cassie的'機器人運動員',在聽到發令槍響的那...
閱讀原文

LLM Agent在交互中學習游戲世界模型和進化行為策略

來源:將門創投 作者:張文祺 來源:公眾號【量子位】 目前,LLM Agent大多專注于特定任務。研究者在了解該任務的領域知識后,手工編寫大量復雜的Prompt,告...
閱讀原文

400米2分34秒破紀錄!伯克利雙足機器人「接管」人類

新智元報道編輯:Aeneas 好困 【新智元導讀】UC伯克利的雙足機器人,400米直接跑進了2分34秒,這個速度屬實是超越不少人類了。而背后的RL通用框架,讓它無論...
閱讀原文

開源版OpenAI機器人2.5萬打造!斯坦福李飛飛團隊祭出「靈巧手」,泡茶剪紙炫技

新智元報道編輯:編輯部 【新智元導讀】「OpenAI機器人」一出世驚艷眾人!最近,李飛飛團隊打造了一個開源便攜式手部動捕系統——DexCap,成本僅3600美元,就能...
閱讀原文