標簽:模型

「不要回答」,數據集來當員,評估LLM安全機制就靠它了

機器之心專欄機器之心編輯部葉文潔打開結果文件,人類第一次讀到了來自宇宙中另一個世界的信息,其內容出乎所有人的想象,它是三條重復的警告:不要回答!不...
閱讀原文

AIGC最新動態丨9月5日行業大匯總!

AIGC行業資訊國外熱點速覽OpenAI 將 Canva 插件引入 ChatGPT;Meta AI研究人員推出OCR神器Nougat;Epic Games Store將接受AI生成游戲內容;AI在線LOGO設計工...
閱讀原文

MVDream:輕松實現從文本到3D渲染圖像

近日,字節跳動研究人員推出了名為MVDream的新技術,它可以僅通過文本描述生成高質量的3D圖像。這種從文本到圖像的生成技術,被稱為“文本到3D”技術,是當前計...
閱讀原文

使用LLM構建AI Agents的正確姿勢!ChatGPT作者博客全面總結

夕小瑤科技說 分享作者 | lilianweng來源 | 深度強化學習實驗室 Lii’Log的博客以LLM(大語言模型)作為核心控制器構建智能體是一個很酷的概念。AutoGPT、GPT-...
閱讀原文

700億參數Llama 2訓練加速195%!訓練/微調/推理全流程方案開源,0代碼一站解決

夕小瑤科技說 分享來源 | 新智元近日,全球規模最大的大模型開發工具與社區Colossal-AI,發布了全套Llama 2訓練、微調、推理方案,可以為700億參數模型的訓練...
閱讀原文

RLHF再也不需要人類了!谷歌團隊研究證明,AI標注已達人類水平

新智元報道編輯:編輯部【新智元導讀】ChatGPT橫空出世后,RLHF成為研究人員關注的焦點。谷歌最新研究提出,不用人類標注,AI標注偏好后,也能取得與RLHF一樣...
閱讀原文

大模型爆發!百度智能云千帆2.0全面升級,訊飛星火正式開放

新智元報道編輯:好困【新智元導讀】9月5日,百度智能云宣布千帆大模型平臺實現2.0全面升級;同日,訊飛星火認知大模型面向全民開放。就在剛剛,百度智能云重...
閱讀原文

混合精度下位置編碼竟有大坑,llama 等主流開源模型紛紛中招!百川智能給出修復方案

作者 | 百川智能 位置編碼技術是一種能夠讓神經網絡建模句子中 Token 位置信息的技術。在 Transformer 大行其道的時代,由于 Attention 結構無法建模每個 tok...
閱讀原文

傳OpenAI秘密訓練GPT-5;騰訊混元大模型或本周亮相;首個中英語音多模態LLM開源

09/04全球AIGC產業要聞1、Meta發布122種語言的機器閱讀理解數據集2、Llama 2全流程解決方案開源 訓練增速195%3、Inflection AI CEO:OpenAI正秘密訓練GPT-54...
閱讀原文

全球近 50 億網民,正在成為 AI 內容的受害者

從興趣到產業鏈上世紀末的作品《攻殼機動隊》中,全身義體化的素子,懷疑自己是否仍然存在。身體、記憶和其他人的關系,當這些事物都能夠被復制,也就無法成...
閱讀原文

9.4丨AIGC大事日報

09/04全球AIGC產業要聞1、Meta發布122種語言的機器閱讀理解數據集2、Llama 2全流程解決方案開源 訓練增速195%3、Inflection AI CEO:OpenAI正秘密訓練GPT-54...
閱讀原文

AI「反腐」,德國馬普所結合 NLP 和 DNN 開發抗蝕合金

By 超神經內容一覽:在被不銹鋼包圍的世界中,我們可能都快忘記了腐蝕的存在。然而,腐蝕存在于生活中的方方面面。無論是銹跡斑斑的鋼釘,老化漏液的電線,還...
閱讀原文

大模型現存的10個問題和挑戰

來源:Coggle數據科學大模型現存的問題和挑戰這篇文章介紹了關于大型語言模型(LLMs)研究中的十個主要方向和問題:1. 減少和度量幻覺:幻覺指的是AI模型虛構...
閱讀原文

大模型在智慧城市設計與運轉中的核心作用

作者:張成文數字化、智能化產品、應用與創新,很大程度上受限于工具、模型、平臺等軟硬件基礎設施的能力。智慧城市建設的順利化程度、它最終表現出來的智慧...
閱讀原文

700億參數LLaMA2訓練加速195%,開箱即用的8到512卡LLaMA2全流程方案來了!

明敏 發自 凹非寺量子位 | 公眾號 QbitAILLaMA2訓練微調推理,大提速了!針對700億版本,訓練加速195%。而且還能基于云平臺實現無代碼訓練個性私有化模型,并...
閱讀原文