使用LLM構建AI Agents的正確姿勢!ChatGPT作者博客全面總結
夕小瑤科技說 分享作者 | lilianweng來源 | 深度強化學習實驗室 Lii’Log的博客以LLM(大語言模型)作為核心控制器構建智能體是一個很酷的概念。AutoGPT、GPT-...
700億參數Llama 2訓練加速195%!訓練/微調/推理全流程方案開源,0代碼一站解決
夕小瑤科技說 分享來源 | 新智元近日,全球規模最大的大模型開發工具與社區Colossal-AI,發布了全套Llama 2訓練、微調、推理方案,可以為700億參數模型的訓練...
RLHF再也不需要人類了!谷歌團隊研究證明,AI標注已達人類水平
新智元報道編輯:編輯部【新智元導讀】ChatGPT橫空出世后,RLHF成為研究人員關注的焦點。谷歌最新研究提出,不用人類標注,AI標注偏好后,也能取得與RLHF一樣...
大模型爆發!百度智能云千帆2.0全面升級,訊飛星火正式開放
新智元報道編輯:好困【新智元導讀】9月5日,百度智能云宣布千帆大模型平臺實現2.0全面升級;同日,訊飛星火認知大模型面向全民開放。就在剛剛,百度智能云重...
GPT-4寫代碼不如ChatGPT,誤用率高達62%!加州大學兩位華人開源代碼可靠性基準RobustAPI
新智元報道編輯:LRS【新智元導讀】代碼能否跑起來的不是判斷可靠性的標準,用語言模型寫代碼還需要考慮生產環境下的預期外輸入。大型語言模型(LLM)在理解...
混合精度下位置編碼竟有大坑,llama 等主流開源模型紛紛中招!百川智能給出修復方案
作者 | 百川智能 位置編碼技術是一種能夠讓神經網絡建模句子中 Token 位置信息的技術。在 Transformer 大行其道的時代,由于 Attention 結構無法建模每個 tok...
蘋果秋季春晚隱藏看點!Apple Watch工藝大改,這些大陸龍頭被帶飛
概念股竄高,蘋果榮耀紛紛押寶,3D打印或掀起消費電子工藝革新潮。作者|云鵬編輯|心緣8天后,蘋果秋季“春晚”即將開幕,今天甚至有人提前放出了疑似蘋果iPhone...
傳OpenAI秘密訓練GPT-5;騰訊混元大模型或本周亮相;首個中英語音多模態LLM開源
09/04全球AIGC產業要聞1、Meta發布122種語言的機器閱讀理解數據集2、Llama 2全流程解決方案開源 訓練增速195%3、Inflection AI CEO:OpenAI正秘密訓練GPT-54...
全球近 50 億網民,正在成為 AI 內容的受害者
從興趣到產業鏈上世紀末的作品《攻殼機動隊》中,全身義體化的素子,懷疑自己是否仍然存在。身體、記憶和其他人的關系,當這些事物都能夠被復制,也就無法成...
9.4丨AIGC大事日報
09/04全球AIGC產業要聞1、Meta發布122種語言的機器閱讀理解數據集2、Llama 2全流程解決方案開源 訓練增速195%3、Inflection AI CEO:OpenAI正秘密訓練GPT-54...
AI「反腐」,德國馬普所結合 NLP 和 DNN 開發抗蝕合金
By 超神經內容一覽:在被不銹鋼包圍的世界中,我們可能都快忘記了腐蝕的存在。然而,腐蝕存在于生活中的方方面面。無論是銹跡斑斑的鋼釘,老化漏液的電線,還...
大模型現存的10個問題和挑戰
來源:Coggle數據科學大模型現存的問題和挑戰這篇文章介紹了關于大型語言模型(LLMs)研究中的十個主要方向和問題:1. 減少和度量幻覺:幻覺指的是AI模型虛構...
蒲慕明:中國腦科學研究怎么做?要堅持這幾個原則
來源:丁香園導讀最近,中國神經科學學會第十六屆全國學術會議暨第二屆中日韓國際會議在廣東珠海國際會展中心順利召開。會議間隙,中國科學院院士、美國國家...
大模型在智慧城市設計與運轉中的核心作用
作者:張成文數字化、智能化產品、應用與創新,很大程度上受限于工具、模型、平臺等軟硬件基礎設施的能力。智慧城市建設的順利化程度、它最終表現出來的智慧...
X / Twitter 更新隱私政策,馬斯克要拿用戶數據訓練 AI了
大數據文摘出品最近兩天,X(原名Twitter,推特)突然更新了隱私政策,在2.1條例中,X明確寫道:We may use the information we collect and publicly availa...