標(biāo)簽:策略
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個(gè)月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會(huì)還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...
從未見過現(xiàn)實(shí)世界數(shù)據(jù),MIT在虛擬環(huán)境中訓(xùn)練出機(jī)器狗,照樣能跑酷
機(jī)器之心報(bào)道 編輯:杜偉如今,機(jī)器人學(xué)習(xí)最大的瓶頸是缺乏數(shù)據(jù)。與圖片和文字相比,機(jī)器人的學(xué)習(xí)數(shù)據(jù)非常稀少。目前機(jī)器人學(xué)科的主流方向是通過擴(kuò)大真實(shí)世界...
過程獎(jiǎng)勵(lì)模型PRM成版本答案!谷歌DeepMind全自動(dòng)標(biāo)注逐步驟獎(jiǎng)勵(lì)PAV,準(zhǔn)確率提升8%
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】通過過程獎(jiǎng)勵(lì)模型(PRM)在每一步提供反饋,并使用過程優(yōu)勢(shì)驗(yàn)證器(PAV)來預(yù)測(cè)進(jìn)展,從而優(yōu)化基礎(chǔ)策略,該方法在測(cè)試時(shí)...
WHALE來了,南大周志華團(tuán)隊(duì)做出更強(qiáng)泛化的世界模型
機(jī)器之心報(bào)道 作者:陳陳、佳琪世界模型又出新進(jìn)展了,來自國內(nèi)機(jī)構(gòu)。人類能夠在腦海中設(shè)想一個(gè)想象中的世界,以預(yù)測(cè)不同的動(dòng)作可能導(dǎo)致不同的結(jié)果。受人類智...
LLM超越人類時(shí)該如何對(duì)齊?谷歌用新RLHF框架解決了這個(gè)問題
機(jī)器之心報(bào)道 編輯:Panda讓 LLM 在自我進(jìn)化時(shí)也能保持對(duì)齊。我們這個(gè)世界是不斷變化的開放世界。人工智能要在這個(gè)世界長久立足,就需要突破許多限制,包括可...
Jim Fan全華人團(tuán)隊(duì)HOVER問世,1.5M小模型讓機(jī)器人獲「潛意識(shí)」!
新智元報(bào)道編輯:靜音 【新智元導(dǎo)讀】來自英偉達(dá)、CMU、UC伯克利等的全華人團(tuán)隊(duì)提出一個(gè)全新的人形機(jī)器人通用的全身控制器HOVER,僅用一個(gè)1.5M參數(shù)模型就可以...
讓機(jī)器人擁有人一樣「潛意識(shí)」,英偉達(dá)1.5M小模型就能實(shí)現(xiàn)通用控制了
機(jī)器之心報(bào)道 編輯:Panda、佳琪當(dāng)機(jī)器人也有潛意識(shí)。大模型固然性能強(qiáng)大,但限制也頗多。如果想在端側(cè)塞進(jìn) 405B 這種級(jí)別的大模型,那真是小廟供不起大菩薩...
強(qiáng)化學(xué)習(xí)訓(xùn)練一兩個(gè)小時(shí),100%自主完成任務(wù):機(jī)器人ChatGPT時(shí)刻真來了?
機(jī)器之心報(bào)道 編輯:Panda、佳琪把平均成功率從 50% 拉到了 100%。最近,AI 的進(jìn)步有目共睹,現(xiàn)在這些進(jìn)步已經(jīng)開始傳遞到機(jī)器人領(lǐng)域。強(qiáng)大的 AI 技術(shù)也能幫助...
AI玩毀滅人類游戲,全程自主操控驚呆教授!Claude 3.5硬核實(shí)測(cè)來襲
新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】Claude游戲測(cè)試,能打幾分?在持續(xù)一個(gè)多小時(shí)毀滅人類游戲中,Claude能制定出長期策略,令人驚喜的同時(shí),也暴露出了AI短...
空間智能如何構(gòu)建?牛津大學(xué)博士論文《深度具身智能體的空間推理與規(guī)劃》230頁pdf
來源:專知 人類能夠通過規(guī)劃、推理和預(yù)測(cè)行動(dòng)結(jié)果,執(zhí)行具有長期目標(biāo)的復(fù)雜任務(wù)。為了讓具身智能體(如機(jī)器人)實(shí)現(xiàn)類似的能力,它們必須獲得可以遷移到新情...
如何通過KV稀疏實(shí)現(xiàn)對(duì)vLLM的1.5倍加速
作者 | PPIO 算法專家張青青前 言近一年以來,自 H2O 起,關(guān)于 KV 稀疏的論文便百花齊放,而在實(shí)際應(yīng)用中不得不面臨的一個(gè)問題便是學(xué)術(shù)論文與實(shí)際應(yīng)用之間的...
Bengio團(tuán)隊(duì)新論文!KL正則化有漏洞,強(qiáng)化學(xué)習(xí)新策略:不要做我可能不會(huì)做的事情
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】在強(qiáng)化學(xué)習(xí)中,當(dāng)智能體的獎(jiǎng)勵(lì)機(jī)制與設(shè)計(jì)者的意圖不一致時(shí),可能會(huì)導(dǎo)致不理想的行為,而KL正則化作為一種常用的解決方案...
李飛飛「數(shù)字表兄弟」機(jī)器人訓(xùn)練難題!零樣本sim2real成功率高達(dá)90%
新智元報(bào)道編輯:編輯部 HXZ 【新智元導(dǎo)讀】在用模擬環(huán)境訓(xùn)練機(jī)器人時(shí),所用的數(shù)據(jù)與真實(shí)世界存在著巨大的差異。為此,李飛飛團(tuán)隊(duì)提出「數(shù)字表親」,這種虛擬...
李飛飛:不要數(shù)字孿生,要數(shù)字表兄弟,一張照片生成機(jī)器人訓(xùn)練場(chǎng)景
機(jī)器之心報(bào)道 編輯:澤南、Panda不百分百還原出虛擬場(chǎng)景,效果反而更好。我們很多人都聽說過數(shù)字孿生(digital twin),在英偉達(dá)等公司的大力推動(dòng)下,這種高...
一文看懂LLM推理,UCL汪軍教授解讀OpenAI ο1的相關(guān)方法
機(jī)器之心報(bào)道 機(jī)器之心編輯部OpenAI 最近發(fā)布的 o1 系列模型堪稱邁向強(qiáng)人工智能的一次飛躍,其強(qiáng)大的推理能力為我們描繪出了下一代人工智能模型的未來圖景。...
綜合RLHF、DPO、KTO優(yōu)勢(shì),統(tǒng)一對(duì)齊框架UNA來了
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
粵公網(wǎng)安備 44011502001135號(hào)