標(biāo)簽：窗口

多輪對話推理速度提升46%，開源方案打破LLM多輪對話的長度限制?

機(jī)器之心發(fā)布機(jī)器之心編輯部在大型語言模型（LLM）的世界中，處理多輪對話一直是一個挑戰(zhàn)。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM，能夠在...

閱讀原文

AIGC動態(tài)

2年前 (2024)

400萬token上下文、推理再加速46%！最新開源方案升級MIT成果，推理成本再降低

明敏發(fā)自凹非寺量子位 | 公眾號 QbitAI22倍加速還不夠，再來提升46%，而且方法直接開源！這就是開源社區(qū)改進(jìn)MIT爆火項(xiàng)目StreamingLLM的最新成果。 Streami...

閱讀原文

AIGC動態(tài)

2年前 (2024)

四行代碼讓大模型上下文暴增3倍，羊駝Mistral都適用

克雷西發(fā)自凹非寺量子位 | 公眾號 QbitAI無需微調(diào)，只要四行代碼就能讓大模型窗口長度暴增，最高可增加3倍！而且是“即插即用”，理論上可以適配任意大模型...

閱讀原文

AIGC動態(tài)

2年前 (2024)

5000萬tokens大海撈針創(chuàng)紀(jì)錄，百川智能192K超長上文+搜索增強(qiáng)商用難題！解決99%企業(yè)定制需求

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】就在昨天，百川智能正式發(fā)布Baichuan2-Turbo系列API，192K的超長上下文窗口+搜索增強(qiáng)知識庫，解決了困擾行業(yè)已久的大...

閱讀原文

AIGC動態(tài)

2年前 (2023)

大模型+搜索構(gòu)建完整技術(shù)棧，百川智能用搜索增強(qiáng)給企業(yè)定制化下了一劑「猛藥」

機(jī)器之心報(bào)道機(jī)器之心編輯部用好企業(yè)知識庫是大模型應(yīng)用破局的關(guān)鍵。從 ChatGPT 最初發(fā)布算起，雖然大模型的熱潮已經(jīng)持續(xù)了一年多，但大部分時間依然停留在...

閱讀原文

AIGC動態(tài)

2年前 (2023)

RAG+GPT-4 Turbo讓模型性能飆升！更長上下文不是終局，「大海撈針」實(shí)驗(yàn)成本僅4%

新智元報(bào)道編輯：桃子【新智元導(dǎo)讀】RAG或許就是大模型能力飆升下一個未來。RAG+GPT-4，4%的成本，便可擁有卓越的性能。這是最新的「大海撈針」實(shí)驗(yàn)得出的結(jié)...

閱讀原文

AIGC動態(tài)

2年前 (2023)

攻其不備：Anthropic發(fā)布Claude 2.1

點(diǎn)擊上方藍(lán)字關(guān)注我們“ Anthropic發(fā)布Claude 2.1，具有巨大的上下文窗口，提供更強(qiáng)大的語言模型和聊天機(jī)器人。雖然有一些限制，但相對于前身有顯著改進(jìn)，包括...

閱讀原文

AIGC動態(tài)

2年前 (2023)

李開復(fù)4個多月后“放大招”：對標(biāo)OpenAI、谷歌，發(fā)布“全球最強(qiáng)”開源大模型

整理 | Tina 今天，由李開復(fù)打造的 AI 大模型創(chuàng)業(yè)公司“零一萬物”發(fā)布了一系列開源大模型：Yi-34B 和 Yi-6B。Yi-34B 是一個雙語（英語和中文）基礎(chǔ)模型，經(jīng)過 ...

閱讀原文

AIGC動態(tài)

2年前 (2023)

李開復(fù)官宣「全球最強(qiáng)」開源大模型：一次處理40萬漢字、中英均霸榜

機(jī)器之心報(bào)道機(jī)器之心編輯部李開復(fù)表示，「零一萬物要躋身全球大模型第一梯隊(duì)。」開源大模型宇宙又有了新的重量級成員，這次是創(chuàng)新工場董事長兼 CE0 李開復(fù)大...

閱讀原文

AIGC動態(tài)

2年前 (2023)

全球最強(qiáng)長文本大模型，一次可讀35萬漢字：Baichuan2-192K上線

機(jī)器之心原創(chuàng)作者：澤南、張倩大模型看書，從來沒有這么快過。國內(nèi)大模型創(chuàng)業(yè)公司，正在技術(shù)前沿創(chuàng)造新的記錄。10 月 30 日，百川智能正式發(fā)布 Baichuan2-192...

閱讀原文

AIGC動態(tài)

2年前 (2023)

百川智能發(fā)布Baichuan2-192K大模型，目前全球最長上下文窗口

文章轉(zhuǎn)自新智元，F(xiàn)ounder Park 有所刪減10 月 30 日，百川智能發(fā)布 Baichuan2-192K 大模型。其上下文窗口長度高達(dá) 192K，是目前全球最長的上下文窗口。文本長...

閱讀原文

AIGC動態(tài)

2年前 (2023)

百川智能推出全球最長上下文窗口大模型Baichuan2-192K，一次可輸入35萬字超越Claude2

10月30日，百川智能發(fā)布Baichuan2-192K大模型，上下文窗口長度高達(dá)192K，是目前全球最長的上下文窗口。Baichuan2-192K能夠一次處理約35萬個漢字，是目前支持...

閱讀原文

AIGC動態(tài)

2年前 (2023)

剛剛，百川智能Baichuan2-192K發(fā)布，上下文窗口全球最長！一次讀完《三體》，拿下7個SOTA

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】全球最長上下文窗口來了！今日，百川智能發(fā)布Baichuan2-192K大模型，上下文窗口長度高達(dá)192K（35萬個漢字），是Claude ...

閱讀原文

AIGC動態(tài)

2年前 (2023)

大模型開啟「長」時代，楊植麟的新公司把對話框容量做到了世界第一

機(jī)器之心原創(chuàng)作者：張倩雖然我們不知道誰是下一個 OpenAI，但是似乎找到了另一個 Anthropic。最近，大模型創(chuàng)投領(lǐng)域又發(fā)生了一件大事：大模型初創(chuàng)公司 Anthrop...

閱讀原文

AIGC動態(tài)

2年前 (2023)

最多400萬token上下文、推理提速22倍，StreamingLLM火了，已獲GitHub 2.5K星

機(jī)器之心報(bào)道編輯：蛋醬如果你體驗(yàn)過與任何一款對話式 AI 機(jī)器人的交流，你一定能想起某些極具「挫敗感」的時刻。比如，你在前一天的對話中講述過的要點(diǎn)，被 ...

閱讀原文

AIGC動態(tài)

2年前 (2023)

123