標簽:上下文
Claude 3相比GPT-4到底強在哪?我整理了一份總結
大數據文摘授權轉載自夕小瑤科技說作者:智商掉了一地 在 AI 領域,大模型的競爭日益激烈,每一次技術的迭代都在推動著智能生成的邊界不斷拓展。距離 Sora 震...
Claude 3 相比 GPT-4 到底強在哪?我整理了一份總結
夕小瑤科技說 原創作者 | 智商掉了一地 在 AI 領域,大模型的競爭日益激烈,每一次技術的迭代都在推動著智能生成的邊界不斷拓展。 距離 Sora 震驚行業內外僅...
DeepMind CEO:LLM+樹搜索就是AGI技術線路,AI科研依賴工程能力,閉源模型就是比開源安全
新智元報道編輯:潤 【新智元導讀】最近谷歌DeepMind的CEO Hassabis接受了多個播客主播的專訪,向大眾透露很多谷歌最近發布模型的內幕,以及他理解的如何通向...
今日Arxiv最熱NLP大模型論文:Llama-2上下文擴大48倍的方法來了,港大發布,無需訓練
夕小瑤科技說 原創作者 | 芒果 引言:大語言模型的長上下文理解能力在當今的人工智能領域,大語言模型(Large Language Models,簡稱LLMs)的長上下文理解能...
陳丹琦團隊新作:Llama-2上下文擴展至128k,10倍吞吐量僅需1/6內存
豐色 發自 凹非寺量子位 | 公眾號 QbitAI陳丹琦團隊剛剛發布了一種新的LLM上下文窗口擴展方法: 它僅用8k大小的token文檔進行訓練,就能將Llama-2窗口擴展至1...
谷歌10M上下文窗口正在RAG?被Sora奪走風頭的Gemini被低估了?
機器之心報道 機器之心編輯部RAG 還有存在的必要嗎?要說最近最郁悶的公司,谷歌肯定算得上一個:自家的 Gemini 1.5 剛剛發布,就被 OpenAI 的 Sora 搶盡了風...
收藏!萬字長文聊聊LLM Agents的現狀,問題與未來
700個開發硬件免費申請?現金大獎!生成式 AI、機器人 AI、PC AI 三大賽道!AMD Pervasive AI 開發者挑戰賽報名火熱進行中,掃碼了解詳情并報名~導讀本文是知...
200萬上下文窗口創飛Gemini 1.5!微軟來砸谷歌場子了(doge)
西風 發自 凹非寺量子位 | 公眾號 QbitAI谷歌剛刷新大模型上下文窗口長度記錄,發布支持100萬token的Gemini 1.5,微軟就來砸場子了。 推出大模型上下文窗口拉...
“打假”Sora,谷歌Gemini 1.5 Pro第一波評測出爐|甲子光年
Gemini 與 Sora 互相傷害。作者|劉楊楠 編輯|趙健 OpenAI 與谷歌同一天發布的兩款 AI 模型正在“互相傷害”。 先是 OpenAI 的 “世界模擬器” Sora 完全搶走了...
Gemini 1.5實測:我看Sora一眼假;還有更多驚艷功能
白交 發自 凹非寺量子位 | 公眾號 QbitAI谷歌の“反擊”來了! Gemini被Sora搶走的風頭,現在有搶回來的勢頭了。 在最新實測中,Gemini 1.5能分析Sora視頻是否A...
Pieter Abbeel新工作“大世界模型”:輕松玩轉 1 小時長視頻,一對一QA視頻內容細節
大數據文摘授權轉載自AI科技評論 作者:賴文昕 編輯:陳彩嫻 自3天前Sora發布以來,由圖靈獎得主、Meta首席科學家Yann LeCun提出的“世界模型”又一次引起了廣...
Pieter Abbeel 新工作“大世界模型”:輕松玩轉 1 小時長視頻,一對一 QA 視頻內容細節
伯克利發布的“大世界模型”,究竟大在哪里?作者丨賴文昕 編輯丨陳彩嫻 自3天前Sora發布以來,由圖靈獎得主、Meta首席科學家Yann LeCun提出的“世界模型”又一次...
100萬token,一次能分析1小時YouTube視頻,「大世界模型」火了
機器之心報道 編輯:陳萍、小舟這項研究為語言模型更好地理解物理世界鋪平了道路。最近幾天,我們接連被谷歌的多模態模型 Gemini 1.5 以及 OpenAI 的視頻生成...
港中文聯合MIT提出超長上下文LongLoRA大模型微調算法
大數據文摘受權轉載自將門創投 現階段,上下文窗口長度基本上成為了評估LLM能力的硬性指標,上下文的長度越長,代表大模型能夠接受的用戶要求越復雜,近期Ope...
今日Arxiv最熱大模型論文:大語言模型真的理解上下文了嗎?新研究揭示驚人發現
夕小瑤科技說 原創 作者 | 松果 探索大型語言模型的上下文理解能力在自然語言處理( Natural Language Processing,NLP)領域,理解上下文是把握人類語言的關...