標簽:策略

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

從未見過現實世界數據,MIT在虛擬環境中訓練出機器狗,照樣能跑酷

機器之心報道 編輯:杜偉如今,機器人學習最大的瓶頸是缺乏數據。與圖片和文字相比,機器人的學習數據非常稀少。目前機器人學科的主流方向是通過擴大真實世界...
閱讀原文

過程獎勵模型PRM成版本答案!谷歌DeepMind全自動標注逐步驟獎勵PAV,準確率提升8%

新智元報道編輯:LRS 【新智元導讀】通過過程獎勵模型(PRM)在每一步提供反饋,并使用過程優勢驗證器(PAV)來預測進展,從而優化基礎策略,該方法在測試時...
閱讀原文

WHALE來了,南大周志華團隊做出更強泛化的世界模型

機器之心報道 作者:陳陳、佳琪世界模型又出新進展了,來自國內機構。人類能夠在腦海中設想一個想象中的世界,以預測不同的動作可能導致不同的結果。受人類智...
閱讀原文

LLM超越人類時該如何對齊?谷歌用新RLHF框架解決了這個問題

機器之心報道 編輯:Panda讓 LLM 在自我進化時也能保持對齊。我們這個世界是不斷變化的開放世界。人工智能要在這個世界長久立足,就需要突破許多限制,包括可...
閱讀原文

Jim Fan全華人團隊HOVER問世,1.5M小模型讓機器人獲「潛意識」!

新智元報道編輯:靜音 【新智元導讀】來自英偉達、CMU、UC伯克利等的全華人團隊提出一個全新的人形機器人通用的全身控制器HOVER,僅用一個1.5M參數模型就可以...
閱讀原文

讓機器人擁有人一樣「潛意識」,英偉達1.5M小模型就能實現通用控制了

機器之心報道 編輯:Panda、佳琪當機器人也有潛意識。大模型固然性能強大,但限制也頗多。如果想在端側塞進 405B 這種級別的大模型,那真是小廟供不起大菩薩...
閱讀原文

強化學習訓練一兩個小時,100%自主完成任務:機器人ChatGPT時刻真來了?

機器之心報道 編輯:Panda、佳琪把平均成功率從 50% 拉到了 100%。最近,AI 的進步有目共睹,現在這些進步已經開始傳遞到機器人領域。強大的 AI 技術也能幫助...
閱讀原文

AI玩毀滅人類游戲,全程自主操控驚呆教授!Claude 3.5硬核實測來襲

新智元報道編輯:桃子 【新智元導讀】Claude游戲測試,能打幾分?在持續一個多小時毀滅人類游戲中,Claude能制定出長期策略,令人驚喜的同時,也暴露出了AI短...
閱讀原文

空間智能如何構建?牛津大學博士論文《深度具身智能體的空間推理與規劃》230頁pdf

來源:專知 人類能夠通過規劃、推理和預測行動結果,執行具有長期目標的復雜任務。為了讓具身智能體(如機器人)實現類似的能力,它們必須獲得可以遷移到新情...
閱讀原文

如何通過KV稀疏實現對vLLM的1.5倍加速

作者 | PPIO 算法專家張青青前 言近一年以來,自 H2O 起,關于 KV 稀疏的論文便百花齊放,而在實際應用中不得不面臨的一個問題便是學術論文與實際應用之間的...
閱讀原文

Bengio團隊新論文!KL正則化有漏洞,強化學習新策略:不要做我可能不會做的事情

新智元報道編輯:LRS 【新智元導讀】在強化學習中,當智能體的獎勵機制與設計者的意圖不一致時,可能會導致不理想的行為,而KL正則化作為一種常用的解決方案...
閱讀原文

李飛飛「數字表兄弟」機器人訓練難題!零樣本sim2real成功率高達90%

新智元報道編輯:編輯部 HXZ 【新智元導讀】在用模擬環境訓練機器人時,所用的數據與真實世界存在著巨大的差異。為此,李飛飛團隊提出「數字表親」,這種虛擬...
閱讀原文

李飛飛:不要數字孿生,要數字表兄弟,一張照片生成機器人訓練場景

機器之心報道 編輯:澤南、Panda不百分百還原出虛擬場景,效果反而更好。我們很多人都聽說過數字孿生(digital twin),在英偉達等公司的大力推動下,這種高...
閱讀原文

一文看懂LLM推理,UCL汪軍教授解讀OpenAI ο1的相關方法

機器之心報道 機器之心編輯部OpenAI 最近發布的 o1 系列模型堪稱邁向強人工智能的一次飛躍,其強大的推理能力為我們描繪出了下一代人工智能模型的未來圖景。...
閱讀原文

綜合RLHF、DPO、KTO優勢,統一對齊框架UNA來了

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文
1237