標簽:上下文

清華微軟開源全新提示詞壓縮工具,長度驟降80%!GitHub怒砍3.1K星

新智元報道編輯:潤 好困 【新智元導讀】最近,清華和微軟的研究人員提出了一種全新的方法,能在保證輸出質量不變的前提下,將提示詞壓縮到原始長度的20%!在...
閱讀原文

Mistral 創始人訪談:和云廠商合作后,立刻獲得了 1000 個客戶

Mistral 可以說是歐洲目前最有代表性的 AI 公司,開源小模型、MoE、專注歐洲多語言市場等等,都讓它與美國的幾家大模型公司如 OpenAI、Anthropic 截然不同。 ...
閱讀原文

一次性支持 200 萬字無損上下文!Kimi智能助手玩了個大的——月之暗面「登月」最新進展!

夕小瑤科技說 原創作者 | 王二狗讓大模型一次性無損地「吃下」一本書已經不是什么稀奇的事了,但如果我告訴你是下面??這樣一本近百萬字的書呢? 沒錯,這么瘋...
閱讀原文

一口氣讀完甄嬛傳劇本、大部頭醫書:月之暗面200萬字上下文Kimi開啟內測

機器之心報道 機器之心編輯部半年時間,月之暗面把 AI 模型支持的上下文長度提升了一個數量級,實現了 200 萬字上下文的「無損壓縮」。 一個能讀 200 萬字的 ...
閱讀原文

Kimi智能助手支持200萬字無損上下文,月之暗面大模型長文本新突破

3 月 18 日,月之暗面(Moonshot AI)宣布在大模型長上下文窗口技術上取得新的突破,Kimi 智能助手已支持 200 萬字超長無損上下文。 即日開啟產品「內測」,...
閱讀原文

月之暗面Kimi模型升級:200萬字窗口版可申請,新增“繼續”功能

衡宇 發自 凹非寺量子位 | 公眾號 QbitAI繼2月以投后約25億美金估值炸場后,楊植麟的大模型公司月之暗面終于有了一次公開對媒體的活動。 雖然楊植麟本人并未...
閱讀原文

GPT-4級模型Grok開源可商用!卷底層大模型的公司危了

夕小瑤科技說 原創作者 | 醒醒上周,馬斯克宣布 xAI 將開源 Grok。 剛剛,馬斯克終于兌現諾言,xAI 宣布開源了 Grok-1 的模型權重和網絡架構。 Grok-1 是一個...
閱讀原文

在筆記本電腦上使用 LLMs 的 5 種方法

點擊上方藍字關注我們在網上使用 ChatGPT 很簡單,只需有網絡連接和好的瀏覽器即可。但這樣做可能會泄露您的隱私和數據。OpenAI 存儲了您的提示和其他元數據...
閱讀原文

零一萬物API正式上線:支持輸入30萬漢字,看不懂《百年孤獨》的人有救了

機器之心報道 作者:蛋醬、杜偉2024 年,大模型領域的一個趨勢越來越清晰:重視優化,面向應用。 在去年的百模大戰中,科技巨頭、創業力量你追我趕,將大模型...
閱讀原文

GPT 4.5意外曝光,或于6月發布,王者即將歸來

點擊上方藍字關注我們“OpenAI意外泄露了GPT-4.5 Turbo的消息。雖然未公布官方聲明,搜索引擎抓取了產品頁面。GPT-4.5 Turbo擁有雙倍上下文窗口,即256,000標...
閱讀原文

GPT-4.5 疑似面世,OpenAI 官網網頁被索引,最快明天發布?

夕小瑤科技說 原創作者 | 付奶茶就在剛剛 GPT-4.5 Turbo 疑似被 OpenAI 網絡團隊泄露了! Bing和DuckDuck Go等搜索引擎在GPT-4.5 Turbo正式發布之前就已經對G...
閱讀原文

GPT-4.5 Turbo意外曝光,官方網頁被扒出,網傳明天就上線

機器之心報道 機器之心編輯部雖然沒等到 GPT-5 的消息,但我們離 GPT-4.5 不遠了。Claude 3 一經推出,AI 初創公司 Anthropic 被推上了大模型浪潮頂端。這一...
閱讀原文

GPT-4.5 Turbo提前泄露?Altman親自暗示新模型要來,傳言本周四上線

新智元報道編輯:alan 好困 【新智元導讀】GPT-4.5 Turbo提前泄露了!預告信息顯示,GPT-4.5 Turbo的上下文窗口比之前的版本翻了一倍,而知識也更新到了2024...
閱讀原文

350億參數、開放權重,Transformer作者創業后推出新大模型

機器之心報道 編輯:杜偉開源大語言模型宇宙又來了一個強勁對手。Transformer 作者參與創立的 Cohere 公司推出的大模型Command-R 在可擴展、RAG和工具使用三...
閱讀原文

清華NLP組發布InfLLM:無需額外訓練,「1024K超長上下文」100%召回!

新智元報道編輯:LRS 【新智元導讀】挖掘大模型固有的長文本理解能力,InfLLM在沒有引入額外訓練的情況下,利用一個外部記憶模塊存儲超長上下文信息,實現了...
閱讀原文
167891015