標簽：模型

大模型的致命缺陷：從GPT到Llama，全都中槍，回答正確率慘不忍睹

夕小瑤科技說分享來源 | 機器之心大模型的邏輯？不存在的。我讓 GPT-3 和 Llama 學會一個簡單的知識：A 就是 B，然后反過來問 B 是什么，結果發現 AI 回答的...

閱讀原文

AIGC動態

2年前 (2023)

CMU+清華開源Prompt2Model框架，性能超越GPT-3.5，僅需1/700的參數量

夕小瑤科技說分享來源 | 新智元基于大型語言模型（LLM），開發者或用戶可以通過描述任務，并給出幾個樣例來構造自然語言提示，很輕松地就能實現指定的功能。...

閱讀原文

AIGC動態

2年前 (2023)

千元預算半天訓練，效果媲美主流大模型，開源可商用中文LLaMA-2

機器之心發布機器之心編輯部LLaMA-2 相較于 LLaMA-1，引入了更多且高質量的語料，實現了顯著的性能提升，全面允許商用，進一步激發了開源社區的繁榮，拓展了...

閱讀原文

AIGC動態

2年前 (2023)

生成式AI時代的模型壓縮與加速，韓松主講MIT課程，資料全公開

機器之心報道編輯：蛋醬近年來，生成式大模型（如大語言模型、擴散模型）已顯示出卓越的性能，但它們需要大量的計算資源。為了讓這些模型更易于使用，提高它...

閱讀原文

AIGC動態

2年前 (2023)

6.7k Star量的vLLM出論文了，讓每個人都能輕松快速低成本地部署LLM服務

機器之心專欄編輯：Panda利用操作系統的虛擬內存管理方法來提升LLM推理吞吐量。今年六月，來自加州大學伯克利分校等機構的一個研究團隊開源了（目前已有 6700...

閱讀原文

AIGC動態

2年前 (2023)

無懼圖像中的文字，TextDiffuser提供更高質量文本渲染

機器之心專欄機器之心編輯部近幾年來，Text-to-Image 領域取得了巨大的進展，特別是在 AIGC（Artificial Intelligence Generated Content）的時代。隨著 DALL...

閱讀原文

AIGC動態

2年前 (2023)

K2喬戈里，上交大團隊推出一個70億參數的地球科學大語言模型

機器之心專欄機器之心編輯部說到世界上最高的山峰大家都能想到是珠穆朗瑪峰，但是世界上的第二高峰就鮮有人知 ——喬戈里峰（又稱 K2，僅以 200 多米之差屈居第...

閱讀原文

AIGC動態

2年前 (2023)

AI Agent 如何實現？6張4090 魔改Llama2：一句指令拆分任務、調用函數

機器之心 SOTA！模型社區專欄作者：星野源專欄編輯：之乎、雅芳、小土同學本專欄由機器之心 SOTA！模型社區出品，每周日于機器之心公眾號持續更新。本周我們...

閱讀原文

AIGC動態

2年前 (2023)

進能形式邏輯，退能四則運算，MAmmoT讓LLM成為數學通才

機器之心報道編輯：Panda一個新數據集外加思維鏈和思維程序兩種方法之長，竟能讓開源 LLM 的數學推理追上 GPT-4 等閉源大模型。數學推理是現代大型語言模型（...

閱讀原文

AIGC動態

2年前 (2023)

麥肯錫：中國生成式AI市場現狀和未來發展趨勢

來源：麥肯錫沒有好問題，就沒有好答案：為什么生成式AI全球增速都這么快？為什么中國的增速遠高于全球？中國的短板有哪些？能補上嗎？——————與傳統AI相比，...

閱讀原文

AIGC動態

2年前 (2023)

OpenAI、Google和Meta 的當紅華人研究員們在想些什么｜對話實錄

座無虛席，過道里也站滿了人。甚至你會以為這是一場明星見面會。但這其實是一場在硅谷進行的GenAI大會的其中一個圓桌。它被安排在“副舞臺”，時間在人們最昏昏...

閱讀原文

AIGC動態

2年前 (2023)

預測編碼和主動推理的大腦結構的演變

來源：CreateAMindThe evolution of brain architectures for predictive coding and active inference抽象的一、簡介2. 預測調節和控制是大腦的基本設計原理...

閱讀原文

AIGC動態

2年前 (2023)

AI算力70年增長6.8億倍，3個歷史階段見證AI技術指數級爆發

新智元報道編輯：潤【新智元導讀】一張圖揭示了AI算力70多年發展了6.7億倍，未來AI各方面能力將全面超越人類，而真正令人期待的是，AI行業才剛剛進入爆發前的...

閱讀原文

AIGC動態

2年前 (2023)

參數量僅為1/700，性能超越GPT-3.5！CMU+清華開源Prompt2Model框架

新智元報道編輯：LRS【新智元導讀】只需要給出任務描述，Prompt2Model直接幫你訓出個模型，性能還比LLM更好！基于大型語言模型（LLM），開發者或用戶可以通過...

閱讀原文

AIGC動態

2年前 (2023)

DALL·E 3必應開測！馬騎宇航員難題攻破，一張畫指定50個物體，微軟前所未有深度參與研究

夢晨發自凹非寺量子位 | 公眾號 QbitAIDALL·E 3限量測試，已由微軟Bing搶先開啟，看看你是歐皇之一嗎？△來自WindowsLatest沒收到資格也沒關系，再加上第三...

閱讀原文

AIGC動態

2年前 (2023)

1…457 458459460 461…483