標(biāo)簽:策略
TPAMI | 安全強(qiáng)化學(xué)習(xí)方法、理論與應(yīng)用綜述,慕工大、同濟(jì)、伯克利等深度解析
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
Google DeepMind推出DemoStart自主強(qiáng)化學(xué)習(xí)方法 利用少量示范樣本實(shí)現(xiàn)復(fù)雜操作任務(wù)
來源:機(jī)器人大講堂 一直以來,研究人員都在試圖開發(fā)出能夠在現(xiàn)實(shí)環(huán)境中安全、高效地執(zhí)行復(fù)雜任務(wù)(如多指手操作)的機(jī)器人技能。傳統(tǒng)的機(jī)器人學(xué)習(xí)方法往往需...
一手訓(xùn)練,多手應(yīng)用:國防科大提出靈巧手抓取策略遷移新方案
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
最高3倍無損提速!數(shù)學(xué)規(guī)劃求解器效率升級,論文已中頂刊TPAMI | 中科大&華為諾亞
HEM++團(tuán)隊 投稿量子位 | 公眾號 QbitAI最高3倍無損提速,用數(shù)學(xué)規(guī)劃求解器尋找最優(yōu)解更快了! 近日,中科大王杰教授團(tuán)隊(MIRA Lab)和華為諾亞方舟實(shí)驗(yàn)室(H...
數(shù)據(jù)治理如何轉(zhuǎn)化為業(yè)務(wù)價值?平安產(chǎn)險的探索與實(shí)踐解析
△大會PPT獲取通道已開啟,關(guān)注數(shù)字化經(jīng)緯公眾號,后臺回復(fù) “PPT”,即可獲取 PPT 下載地址 嘉賓 | 洪廣智 平安產(chǎn)險客戶大數(shù)據(jù)團(tuán)隊平臺組負(fù)責(zé)人 編輯 | 高玉嫻 ...
ECCV 2024 | 探索離散Token視覺生成中的自適應(yīng)推理策略
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
o1突發(fā)曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護(hù)城河
明敏 發(fā)自 凹非寺量子位 | 公眾號 QbitAI發(fā)布不到1周,OpenAI最強(qiáng)模型o1的護(hù)城河已經(jīng)沒有了。 有人發(fā)現(xiàn),谷歌DeepMind一篇發(fā)表在8月的論文,揭示原理和o1的工...
o1 改變了 Scaling 范式?Self-Play 還值得 All In 嗎?
機(jī)器之心PRO · 會員通訊 Week 37---- 本周為您解讀 ③個值得細(xì)品的AI & Robotics業(yè)內(nèi)要事 ---- 1. o1 改變了 Scaling 范式?Self-Play 還值得 All In 嗎?...
小模型越級挑戰(zhàn)14倍參數(shù)大模型,谷歌開啟Test-Time端新的Scaling Law
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI不必增加模型參數(shù),計算資源相同,小模型性能超過比它大14倍的模型! 谷歌DeepMind最新研究引發(fā)熱議,甚至有人表示這...
大模型走向物理世界,TeleAI 發(fā)布大模型驅(qū)動的具身智能綜述,覆蓋300篇文獻(xiàn)
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
機(jī)器人有了"迪士尼魔法"!AI教機(jī)器人像卡通人物一樣流暢逼真地跳舞
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自機(jī)器人大講堂在計算機(jī)動畫和機(jī)器人控制領(lǐng)域,如何讓虛擬角色或?qū)嶓w機(jī)器人按照預(yù)設(shè)軌跡精確執(zhí)行動作,一直是一個充滿挑戰(zhàn)的難題。近日,...
Cross-Embodiment/數(shù)據(jù)集/VLA,具身智能今年的研究重點(diǎn)在哪?
機(jī)器之心PRO · 會員通訊 Week 35---- 本周為您解讀 ③個值得細(xì)品的AI & Robotics業(yè)內(nèi)要事 ---- 1.Cross-Embodiment/數(shù)據(jù)集/VLA,具身智能今年的研究重點(diǎn)在...
DeepSeek開源數(shù)學(xué)大模型,高中、大學(xué)定理證明新SOTA
機(jī)器之心報道 機(jī)器之心編輯部DeepSeek-Prover-V1.5 通過結(jié)合強(qiáng)化學(xué)習(xí)和蒙特卡洛樹搜索,顯著提升了證明生成的效率和準(zhǔn)確性。AI 技術(shù)與數(shù)學(xué)發(fā)現(xiàn)的進(jìn)展,正前所...
香港理工:你精心設(shè)計的prompt,很容易被用戶套出來!
夕小瑤科技說 原創(chuàng)作者 | 謝年年自O(shè)penAI的GPT系列及微軟Copilot Studio驚艷登場以來,第三方開發(fā)者群體迅速壯大,他們巧妙地設(shè)計個性化prompts,并與專業(yè)領(lǐng)...
首個支持普通話和方言混說的TTS大模型:河南話、上海話、粵語說得溜
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
粵公網(wǎng)安備 44011502001135號