標(biāo)簽：長上

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經(jīng)常用來日常寫作，雖然本身提供了AI功能，但可惜需要會員，本文教你三分鐘接入最火的DeepSeek，讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址：http:/...

閱讀原文

AI教程

8個月前

AI賺錢副業(yè)~AI生成影視解說，半個月漲粉變現(xiàn)3.5W+！

這兩年大家都在感嘆生活不易，然而我想說的是，機會還是有的，但問題不在于有沒有，而在于你是否能夠認(rèn)準(zhǔn)機會，然后抓住它。接觸過很多咨詢項目的人，發(fā)現(xiàn)...

使用教程

1年前 (2024)

米開朗基羅怎么說？谷歌DeepMind推出長上下文評估新框架

新智元報道編輯：alan 【新智元導(dǎo)讀】近日，來自谷歌DeepMind的研究人員提出了Michelangelo，「用米開朗基羅的觀點」來測量任意上下文長度的基礎(chǔ)模型性能。米...

閱讀原文

AIGC動態(tài)

1年前 (2024)

Jamba 1.5發(fā)布，最長上下文，非Transformer架構(gòu)首次成功領(lǐng)先

昨天，號稱當(dāng)前最強、最高效的長上下文模型——Jamba 1.5 系列發(fā)布。 Jamba 是第一個基于 Mamba 架構(gòu)的生產(chǎn)級模型。Mamba 是由卡內(nèi)基梅隆大學(xué)和普林斯頓大學(xué)的...

閱讀原文

AIGC動態(tài)

1年前 (2024)

支持1024幀、準(zhǔn)確率近100％，英偉達「LongVILA」開始發(fā)力長視頻

機器之心報道編輯：杜偉、陳陳現(xiàn)在，長上下文視覺語言模型（VLM）有了新的全棧解決方案 ——LongVILA，它集系統(tǒng)、模型訓(xùn)練與數(shù)據(jù)集開發(fā)于一體。現(xiàn)階段，將模型...

閱讀原文

AIGC動態(tài)

1年前 (2024)

無一大模型及格！北大/通研院提出超難基準(zhǔn)，專門評估長文本理解生成

LooGLE團隊投稿自凹非寺量子位 | 公眾號 QbitAI在長文本理解能力這塊，竟然沒有一個大模型及格！北大聯(lián)合北京通用人工智能研究院提出了一個新基準(zhǔn)數(shù)據(jù)集：...

閱讀原文

AIGC動態(tài)

1年前 (2024)

NVIDIA把Llama-3的上下文長度擴展16倍，長上下文理解能力超越GPT-4

夕小瑤科技說原創(chuàng)作者 | Richard在 Llama-3.1 模型發(fā)布之前，開源模型與閉源模型的性能之間一直存在較大的差距，尤其是在長上下文理解能力上。大模型的上下...

閱讀原文

AIGC動態(tài)

1年前 (2024)

7B最強長視頻模型！ LongVA視頻理解超千幀，霸榜多個榜單

AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年，機器之心AIxiv專欄接收報道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級實驗室，有效促進了學(xué)術(shù)...

閱讀原文

AIGC動態(tài)

1年前 (2024)

Gemini 1.5 Pro裝進機器人，參觀一遍公司就能禮賓、帶路

機器之心報道編輯：張倩長上下文大模型幫助機器人理解世界。最近，谷歌 DeepMind 突然開始炫起了機器人。這個機器人可以輕松聽從人類指令、進行視覺導(dǎo)覽，用...

閱讀原文

AIGC動態(tài)

1年前 (2024)

超越 Transformer 與 Mamba，Meta 聯(lián)合斯坦福等高校推出最強架構(gòu) TTT

作者 | 趙明華近日，斯坦福、UCSD、UC 伯克利和 Meta 的研究人員提出了一種全新架構(gòu)，用機器學(xué)習(xí)模型取代 RNN 的隱藏狀態(tài)。圖 1 所有序列建模層都可以表示...

閱讀原文

AIGC動態(tài)

1年前 (2024)

單卡A100實現(xiàn)百萬token推理，速度快10倍，這是微軟官方的大模型推理加速

機器之心報道編輯：張倩、陳萍微軟的這項研究讓開發(fā)者可以在單卡機器上以 10 倍的速度處理超過 1M 的輸入文本。大型語言模型 (LLM) 已進入長上下文處理時代...

閱讀原文

AIGC動態(tài)

1年前 (2024)

強強聯(lián)合！當(dāng)RAG遇到長上下文，滑鐵盧大學(xué)發(fā)布LongRAG，效果領(lǐng)先GPT-4 Turbo 50%

夕小瑤科技說原創(chuàng)作者 | Axe_越過猶不及——《論語·先進》大學(xué)考試時，有些老師允許帶備cheet sheet（忘紙條）,上面記著關(guān)鍵公式和定義,幫助我們快速作答提高...

閱讀原文

AIGC動態(tài)

1年前 (2024)

谷歌重磅：告別RAG，長上下文的大語言模型無需檢索增強

夕小瑤科技說原創(chuàng)作者 | Richard當(dāng)今人工智能領(lǐng)域正在經(jīng)歷一場靜默的革命。隨著大語言模型(LLM)的快速發(fā)展，它們不僅能夠處理更長的上下文，還展現(xiàn)出驚人的...

閱讀原文

AIGC動態(tài)

1年前 (2024)

一次可輸入多張圖像，還能多輪對話！最新開源數(shù)據(jù)集，讓AI更接近現(xiàn)實

劉子煜投稿量子位 | 公眾號 QbitAI大模型對話能更接近現(xiàn)實了！不僅可以最多輸入20張圖像，還能支持多達27輪對話。可處理文本+圖像tokens最多18k。這就是最...

閱讀原文

AIGC動態(tài)

1年前 (2024)

英偉達新研究：上下文長度虛標(biāo)嚴(yán)重，32K性能合格的都不多

西風(fēng) 發(fā)自凹非寺量子位 | 公眾號 QbitAI無情戳穿“長上下文”大模型的虛標(biāo)現(xiàn)象—— 英偉達新研究發(fā)現(xiàn)，包括GPT-4在內(nèi)的10個大模型，生成達到128k甚至1M上下文長...

閱讀原文

AIGC動態(tài)

1年前 (2024)

速度秒殺GPT-4o！Mistral開源首個22B代碼模型破記錄，支持80+編程語言

新智元報道編輯：喬楊好困【新智元導(dǎo)讀】就在剛剛，法國AI初創(chuàng)公司Mistral發(fā)布了自家首款代碼生成模型Codestral。不僅支持32K長上下文窗口以及80多種編程語...

閱讀原文

AIGC動態(tài)

1年前 (2024)

拯救被「掰彎」的GPT-4！西交微軟北大聯(lián)合提出IN2訓(xùn)練治療LLM「中間迷失」

新智元報道編輯：alan 【新智元導(dǎo)讀】近日，西交微軟北大聯(lián)合提出信息密集型訓(xùn)練大法，使用純數(shù)據(jù)驅(qū)動的方式，矯正LLM訓(xùn)練過程產(chǎn)生的偏見，在一定程度上治療...

閱讀原文

AIGC動態(tài)

1年前 (2024)

12 3