標簽:窗口
多輪對話推理速度提升46%,開源方案打破LLM多輪對話的長度限制?
機器之心發布 機器之心編輯部在大型語言模型(LLM)的世界中,處理多輪對話一直是一個挑戰。前不久麻省理工 Guangxuan Xiao 等人推出的 StreamingLLM,能夠在...
400萬token上下文、推理再加速46%!最新開源方案升級MIT成果,推理成本再降低
明敏 發自 凹非寺量子位 | 公眾號 QbitAI22倍加速還不夠,再來提升46%,而且方法直接開源! 這就是開源社區改進MIT爆火項目StreamingLLM的最新成果。 Streami...
四行代碼讓大模型上下文暴增3倍,羊駝Mistral都適用
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI無需微調,只要四行代碼就能讓大模型窗口長度暴增,最高可增加3倍! 而且是“即插即用”,理論上可以適配任意大模型...
5000萬tokens大海撈針創紀錄,百川智能192K超長上文+搜索增強商用難題!解決99%企業定制需求
新智元報道編輯:編輯部 【新智元導讀】就在昨天,百川智能正式發布Baichuan2-Turbo系列API,192K的超長上下文窗口+搜索增強知識庫,解決了困擾行業已久的大...
大模型+搜索構建完整技術棧,百川智能用搜索增強給企業定制化下了一劑「猛藥」
機器之心報道 機器之心編輯部用好企業知識庫是大模型應用破局的關鍵。 從 ChatGPT 最初發布算起,雖然大模型的熱潮已經持續了一年多,但大部分時間依然停留在...
RAG+GPT-4 Turbo讓模型性能飆升!更長上下文不是終局,「大海撈針」實驗成本僅4%
新智元報道編輯:桃子【新智元導讀】RAG或許就是大模型能力飆升下一個未來。RAG+GPT-4,4%的成本,便可擁有卓越的性能。這是最新的「大海撈針」實驗得出的結...
攻其不備:Anthropic發布Claude 2.1
點擊上方藍字關注我們“ Anthropic發布Claude 2.1,具有巨大的上下文窗口,提供更強大的語言模型和聊天機器人。雖然有一些限制,但相對于前身有顯著改進,包括...
李開復4個多月后“放大招”:對標OpenAI、谷歌,發布“全球最強”開源大模型
整理 | Tina 今天,由李開復打造的 AI 大模型創業公司“零一萬物”發布了一系列開源大模型:Yi-34B 和 Yi-6B。Yi-34B 是一個雙語(英語和中文)基礎模型,經過 ...
李開復官宣「全球最強」開源大模型:一次處理40萬漢字、中英均霸榜
機器之心報道機器之心編輯部李開復表示,「零一萬物要躋身全球大模型第一梯隊。」開源大模型宇宙又有了新的重量級成員,這次是創新工場董事長兼 CE0 李開復大...
全球最強長文本大模型,一次可讀35萬漢字:Baichuan2-192K上線
機器之心原創作者:澤南、張倩大模型看書,從來沒有這么快過。國內大模型創業公司,正在技術前沿創造新的記錄。10 月 30 日,百川智能正式發布 Baichuan2-192...
百川智能發布Baichuan2-192K大模型,目前全球最長上下文窗口
文章轉自新智元,Founder Park 有所刪減10 月 30 日,百川智能發布 Baichuan2-192K 大模型。其上下文窗口長度高達 192K,是目前全球最長的上下文窗口。文本長...
百川智能推出全球最長上下文窗口大模型Baichuan2-192K,一次可輸入35萬字超越Claude2
10月30日,百川智能發布Baichuan2-192K大模型,上下文窗口長度高達192K,是目前全球最長的上下文窗口。Baichuan2-192K能夠一次處理約35萬個漢字,是目前支持...
剛剛,百川智能Baichuan2-192K發布,上下文窗口全球最長!一次讀完《三體》,拿下7個SOTA
新智元報道編輯:編輯部【新智元導讀】全球最長上下文窗口來了!今日,百川智能發布Baichuan2-192K大模型,上下文窗口長度高達192K(35萬個漢字),是Claude ...
大模型開啟「長」時代,楊植麟的新公司把對話框容量做到了世界第一
機器之心原創作者:張倩雖然我們不知道誰是下一個 OpenAI,但是似乎找到了另一個 Anthropic。最近,大模型創投領域又發生了一件大事:大模型初創公司 Anthrop...
最多400萬token上下文、推理提速22倍,StreamingLLM火了,已獲GitHub 2.5K星
機器之心報道編輯:蛋醬如果你體驗過與任何一款對話式 AI 機器人的交流,你一定能想起某些極具「挫敗感」的時刻。比如,你在前一天的對話中講述過的要點,被 ...