標簽：本文

你沒有看過的全新版本，Transformer數學原理揭秘

機器之心報道編輯：趙陽近日，arxiv 上發布了一篇論文，對 Transformer 的數學原理進行全新解讀，內容很長，知識很多，十二分建議閱讀原文。2017 年，Vaswan...

閱讀原文

AIGC動態

2年前 (2024)

Ilya牽頭，OpenAI發布超級對齊項目：AI對齊AI，GPT-2能監督GPT-4

文章轉自公眾號「機器之心」。過去一年，以「預測下一個 Token」為本質的大模型已經橫掃人類世界的多項任務，展現了人工智能的巨大潛力。在近日的一次訪談中...

閱讀原文

AIGC動態

2年前 (2023)

GPT-2能監督GPT-4，Ilya帶頭OpenAI超級對齊首篇論文來了：AI對齊AI取得實證結果

機器之心報道編輯：陳萍、蛋醬人類無法監督超級人工智能，但人工智能可以。過去一年，以「預測下一個 Token」為本質的大模型已經橫掃人類世界的多項任務，展...

閱讀原文

AIGC動態

2年前 (2023)

大道至簡？ETH研究團隊提出簡化版Transformer模型，綜合效率明顯提升

大數據文摘受權轉載自將門創投?2023年，Transformer已經成為人工智能領域中最受歡迎的基礎模型，如今火熱的大型語言模型，多模態大模型均由不同類型的Transfo...

閱讀原文

AIGC動態

2年前 (2023)

不到1000行代碼，PyTorch團隊讓Llama 7B提速10倍

機器之心報道編輯：陳萍PyTorch 團隊親自教你如何加速大模型推理。在過去的一年里，生成式 AI 發展迅猛，在這當中，文本生成一直是一個特別受歡迎的領域，很...

閱讀原文

AIGC動態

2年前 (2023)

PyTorch團隊重寫「分割一切」模型，比原始實現快8倍

機器之心報道編輯：陳萍我們該如何優化 Meta 的「分割一切」模型，PyTorch 團隊撰寫的這篇博客由淺入深的幫你解答。從年初到現在，生成式 AI 發展迅猛。但很...

閱讀原文

AIGC動態

2年前 (2023)

Stable Video Diffusion來了，代碼權重已上線

機器之心報道機器之心編輯部Stability AI 的視頻生成模型看來效果不錯。AI 畫圖的著名公司 Stability AI，終于入局 AI 生成視頻了。本周二，基于 Stable Diff...

閱讀原文

AIGC動態

2年前 (2023)

13B模型全方位碾壓GPT-4？這背后有什么貓膩

機器之心報道編輯：陳萍你的測試集信息在訓練集中泄漏了嗎？一個參數量為 13B 的模型竟然打敗了頂流 GPT-4？就像下圖所展示的，并且為了確保結果的有效性，這...

閱讀原文

AIGC動態

2年前 (2023)

給大模型評分的基準靠譜嗎？Anthropic來了次大評估

選自Anthropic機器之心編譯機器之心編輯部在大模型（LLM）盛行的當下，評估 AI 系統成為了重要的一環，在評估過程中都會遇到哪些困難，Anthropic 的一篇文章...

閱讀原文

AIGC動態

2年前 (2023)

DeepMind：誰說卷積網絡不如ViT？

機器之心報道編輯：陳萍、小舟本文通過評估按比例擴大的 NFNets，挑戰了 ConvNets 在大規模上表現不如 ViTs 的觀點。深度學習的早期成功可歸功于卷積神經網絡...

閱讀原文

AIGC動態

2年前 (2023)

復旦大合華為諾亞提出VidRD框架，實現迭代式的高質量視頻生成

機器之心專欄機器之心編輯部本文提出了一個名為 “Reuse and Diffuse” 的框架。該框架可以在 LDM 已經生成的少部分視頻幀之后，產生更多的視頻幀，從而實現迭...

閱讀原文

AIGC動態

2年前 (2023)

MiniGPT-4升級到MiniGPT-v2了，不用GPT-4照樣完成多模態任務

機器之心專欄機器之心編輯部MiniGPT-v2 將大語言模型作為視覺語言多任務學習的統一接口。幾個月前，來自 KAUST（沙特阿卜杜拉國王科技大學）的幾位研究者提出...

閱讀原文

AIGC動態

2年前 (2023)

選擇GPT-3.5、還是微調Llama 2等開源模型？綜合比較后答案有了

機器之心編譯選自 ragntune 的博客編輯：rome rome通過對 GPT-3.5 和 Llama 2 在不同任務上的微調對比，我們可以得知在什么情況下選擇 GPT-3.5，什么情況下選...

閱讀原文

AIGC動態

2年前 (2023)

在圖像、視頻生成上，語言模型首次擊敗擴散模型，tokenizer是關鍵

機器之心報道編輯：張倩、陳萍為什么語言模型在視覺生成方面落后于擴散模型？來自谷歌、CMU 的研究表明，tokenizer 是關鍵。大型語言模型（LLM 或 LM）一開始...

閱讀原文

AIGC動態

2年前 (2023)

建議收藏！Stable Diffusion 從入門到精通之超全提示詞手冊

本文系統、專業、詳盡地介紹了Stable Diffusion的提示詞Prompt的大量專業知識。Prompt，譯為提示詞，指的是以書面或口頭語言形式向計算機系統發出的指令。在 ...

閱讀原文

AIGC動態

2年前 (2023)

1 234