標簽:算法
有了GPT-4之后,機器人把轉筆、盤核桃都學會了
機器之心報道編輯:張倩、陳萍GPT-4 和強化學習強強聯合,機器人的未來將是什么樣子?在學習方面,GPT-4 是一個厲害的學生。在消化了大量人類數據后,它掌握...
是時候徹底放棄“高分低能”的Leetcode了:AI時代的面試需要大變革!
編譯 | 核子可樂、Tina 隨著軟件開發行業正發生整體轉變,我們越來越依賴 Copilot 和 GPT 等 AI 工具來生成代碼、提高生產力,所以必然要據此調整對人才的甄...
在RTX 4090被限制的時代下,讓大模型使用RLHF更高效的方法來了
機器之心專欄機器之心編輯部該論文介紹了一種名為 ReMax 的新算法,專為基于人類反饋的強化學習(RLHF)而設計。ReMax 在計算效率(約減少 50% 的 GPU 內存和...
未來大模型頂會?陳丹琦等人組織首屆COLM,為語言建模研究提供新平臺
機器之心報道編輯:大盤雞獲得了眾多學術大牛的支持。隨著 ChatGPT 的爆火,NLP、大模型領域已經是個「一天不看新聞就會落后」的地方。雖然如今 AI 領域的頂...
引入大語言模型、首個支持國產算力生態,全新開源RL框架RLLTE來了
機器之心專欄機器之心編輯部本文中,來自香港理工大學、寧波東方理工大學(暫名)、普渡大學和大疆科技的研究者和算法團隊發布了名為 RLLTE 的開源強化學習框...
成本低至16.8萬的人形機器人,正在成為現實
大數據文摘授權轉載自AI科技評論作者:郭思編輯:陳彩嫻9月底,一則關于特斯拉機器人的視頻流出,外界看到了Optimus擎天柱機器人的最新進展。與此同時,在推...
新型威脅:探索 LLM 攻擊對網絡安全的沖擊
作者 | Anthony Alford 譯者 | 平川 策劃 | 丁曉昀 來自卡內基梅隆大學(CMU)的研究人員發布了 LLM Attacks,這是一種可以針對各種大型語言模型(LLM)構建...
成本低至 16.8 萬的人形機器人,正在成為現實
企業家的嘴:一面說AI毀滅人類,一面又在不斷點燃具身智能技術火焰。作者丨郭思編輯丨陳彩嫻9月底,一則關于特斯拉機器人的視頻流出,外界看到了Optimus擎天...
TradeMaster最新發布沙盒工具箱,探索量化交易的全新維度
TradeMaster 是由新加坡南洋理工大學開發的一款基于強化學習的開源量化交易平臺。為了更全面地評價和提升算法性能,我們推出了沙盒工具箱,同時搭配了易于使...
Hugging Face 大語言模型優化技術
作者 | Sergio De Simone 譯者 | 明知山 策劃 | 丁曉昀 大語言模型的生產部署存在兩個主要的挑戰,一個是需要大量的參數,一個是需要處理非常長的用于表示上...
從馬賽克到高清圖,AI生圖能力變強了,但如何取得美感與失真的平衡?
機器之心編譯編輯:rome rome讓圖像看起來更好的 AI 工具,往往會導致圖像失真,而讓圖像看起來更真實時,往往會缺少美感,這一問題該如何權衡?在懸疑和科幻...
Astronomaly:利用 CNN 和主動學習識別 400 萬張星系圖像中的異常
點擊上方藍字,關注我們!By 超神經星系中的異常現象是我們了解宇宙的關鍵。然而,隨著天文觀測技術的發展,天文數據正以指數級別增長,超出了天文工作者的分...
從觀察、思考到行動,深度強化學牛Pieter Abbeel談如何馴服機器人
機器之心報道編輯:大盤雞這樣學,還能那樣學。人類的大腦具有學習新事物的能力,而且學習方式多種多樣,從模仿他人到觀看在線解說視頻,不一而足。如果機器...
2012,改變人類命運的 180 天
偉大是如何誕生的?本文經授權轉自《遠川研究所》;作者:李墨天,編輯:戴老板2012 年 12 月初的一天,一場秘密競拍正在美國滑雪勝地太浩湖(Lake Tahoe)的...
清華、微軟等淘汰提示工程師?LLM與進化算法結合,創造超強提示優化器
新智元報道編輯:潤 Lumina【新智元導讀】提示工程可以自動化了?EvoPrompt的出現解決了大型語言模型性能依賴高質量提示的挑戰,同時展示了LLM在傳統算法中的...