標(biāo)簽:本文

你沒有看過的全新版本,Transformer數(shù)學(xué)原理揭秘

機(jī)器之心報道 編輯:趙陽近日,arxiv 上發(fā)布了一篇論文,對 Transformer 的數(shù)學(xué)原理進(jìn)行全新解讀,內(nèi)容很長,知識很多,十二分建議閱讀原文。2017 年,Vaswan...
閱讀原文

Ilya牽頭,OpenAI發(fā)布超級對齊項目:AI對齊AI,GPT-2能監(jiān)督GPT-4

文章轉(zhuǎn)自公眾號「機(jī)器之心」。過去一年,以「預(yù)測下一個 Token」為本質(zhì)的大模型已經(jīng)橫掃人類世界的多項任務(wù),展現(xiàn)了人工智能的巨大潛力。在近日的一次訪談中...
閱讀原文

GPT-2能監(jiān)督GPT-4,Ilya帶頭OpenAI超級對齊首篇論文來了:AI對齊AI取得實證結(jié)果

機(jī)器之心報道編輯:陳萍、蛋醬人類無法監(jiān)督超級人工智能,但人工智能可以。過去一年,以「預(yù)測下一個 Token」為本質(zhì)的大模型已經(jīng)橫掃人類世界的多項任務(wù),展...
閱讀原文

大道至簡?ETH研究團(tuán)隊提出簡化版Transformer模型,綜合效率明顯提升

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門創(chuàng)投?2023年,Transformer已經(jīng)成為人工智能領(lǐng)域中最受歡迎的基礎(chǔ)模型,如今火熱的大型語言模型,多模態(tài)大模型均由不同類型的Transfo...
閱讀原文

不到1000行代碼,PyTorch團(tuán)隊讓Llama 7B提速10倍

機(jī)器之心報道編輯:陳萍PyTorch 團(tuán)隊親自教你如何加速大模型推理。在過去的一年里,生成式 AI 發(fā)展迅猛,在這當(dāng)中,文本生成一直是一個特別受歡迎的領(lǐng)域,很...
閱讀原文

Stable Video Diffusion來了,代碼權(quán)重已上線

機(jī)器之心報道機(jī)器之心編輯部Stability AI 的視頻生成模型看來效果不錯。AI 畫圖的著名公司 Stability AI,終于入局 AI 生成視頻了。本周二,基于 Stable Diff...
閱讀原文

PyTorch團(tuán)隊重寫「分割一切」模型,比原始實現(xiàn)快8倍

機(jī)器之心報道編輯:陳萍我們該如何優(yōu)化 Meta 的「分割一切」模型,PyTorch 團(tuán)隊撰寫的這篇博客由淺入深的幫你解答。從年初到現(xiàn)在,生成式 AI 發(fā)展迅猛。但很...
閱讀原文

13B模型全方位碾壓GPT-4?這背后有什么貓膩

機(jī)器之心報道編輯:陳萍你的測試集信息在訓(xùn)練集中泄漏了嗎?一個參數(shù)量為 13B 的模型竟然打敗了頂流 GPT-4?就像下圖所展示的,并且為了確保結(jié)果的有效性,這...
閱讀原文

給大模型評分的基準(zhǔn)靠譜嗎?Anthropic來了次大評估

選自Anthropic機(jī)器之心編譯機(jī)器之心編輯部在大模型(LLM)盛行的當(dāng)下,評估 AI 系統(tǒng)成為了重要的一環(huán),在評估過程中都會遇到哪些困難,Anthropic 的一篇文章...
閱讀原文

DeepMind:誰說卷積網(wǎng)絡(luò)不如ViT?

機(jī)器之心報道編輯:陳萍、小舟本文通過評估按比例擴(kuò)大的 NFNets,挑戰(zhàn)了 ConvNets 在大規(guī)模上表現(xiàn)不如 ViTs 的觀點。深度學(xué)習(xí)的早期成功可歸功于卷積神經(jīng)網(wǎng)絡(luò)...
閱讀原文

復(fù)旦大合華為諾亞提出VidRD框架,實現(xiàn)迭代式的高質(zhì)量視頻生成

機(jī)器之心專欄機(jī)器之心編輯部本文提出了一個名為 “Reuse and Diffuse” 的框架。該框架可以在 LDM 已經(jīng)生成的少部分視頻幀之后,產(chǎn)生更多的視頻幀,從而實現(xiàn)迭...
閱讀原文

MiniGPT-4升級到MiniGPT-v2了,不用GPT-4照樣完成多模態(tài)任務(wù)

機(jī)器之心專欄機(jī)器之心編輯部MiniGPT-v2 將大語言模型作為視覺語言多任務(wù)學(xué)習(xí)的統(tǒng)一接口。幾個月前,來自 KAUST(沙特阿卜杜拉國王科技大學(xué))的幾位研究者提出...
閱讀原文

選擇GPT-3.5、還是微調(diào)Llama 2等開源模型?綜合比較后答案有了

機(jī)器之心編譯選自 ragntune 的博客編輯:rome rome通過對 GPT-3.5 和 Llama 2 在不同任務(wù)上的微調(diào)對比,我們可以得知在什么情況下選擇 GPT-3.5,什么情況下選...
閱讀原文

在圖像、視頻生成上,語言模型首次擊敗擴(kuò)散模型,tokenizer是關(guān)鍵

機(jī)器之心報道編輯:張倩、陳萍為什么語言模型在視覺生成方面落后于擴(kuò)散模型?來自谷歌、CMU 的研究表明,tokenizer 是關(guān)鍵。大型語言模型(LLM 或 LM)一開始...
閱讀原文

建議收藏!Stable Diffusion 從入門到精通之超全提示詞手冊

本文系統(tǒng)、專業(yè)、詳盡地介紹了Stable Diffusion的提示詞Prompt的大量專業(yè)知識。Prompt,譯為提示詞,指的是以書面或口頭語言形式向計算機(jī)系統(tǒng)發(fā)出的指令。在 ...
閱讀原文
1234