標簽：上下文

Claude 3相比GPT-4到底強在哪？我整理了一份總結

大數據文摘授權轉載自夕小瑤科技說作者：智商掉了一地在 AI 領域，大模型的競爭日益激烈，每一次技術的迭代都在推動著智能生成的邊界不斷拓展。距離 Sora 震...

閱讀原文

AIGC動態

2年前 (2024)

Claude 3 相比 GPT-4 到底強在哪？我整理了一份總結

夕小瑤科技說原創作者 | 智商掉了一地在 AI 領域，大模型的競爭日益激烈，每一次技術的迭代都在推動著智能生成的邊界不斷拓展。距離 Sora 震驚行業內外僅...

閱讀原文

AIGC動態

2年前 (2024)

DeepMind CEO：LLM+樹搜索就是AGI技術線路，AI科研依賴工程能力，閉源模型就是比開源安全

新智元報道編輯：潤【新智元導讀】最近谷歌DeepMind的CEO Hassabis接受了多個播客主播的專訪，向大眾透露很多谷歌最近發布模型的內幕，以及他理解的如何通向...

閱讀原文

AIGC動態

2年前 (2024)

今日Arxiv最熱NLP大模型論文：Llama-2上下文擴大48倍的方法來了，港大發布，無需訓練

夕小瑤科技說原創作者 | 芒果引言：大語言模型的長上下文理解能力在當今的人工智能領域，大語言模型（Large Language Models，簡稱LLMs）的長上下文理解能...

閱讀原文

AIGC動態

2年前 (2024)

陳丹琦團隊新作：Llama-2上下文擴展至128k，10倍吞吐量僅需1/6內存

豐色發自凹非寺量子位 | 公眾號 QbitAI陳丹琦團隊剛剛發布了一種新的LLM上下文窗口擴展方法：它僅用8k大小的token文檔進行訓練，就能將Llama-2窗口擴展至1...

閱讀原文

AIGC動態

2年前 (2024)

谷歌10M上下文窗口正在RAG？被Sora奪走風頭的Gemini被低估了？

機器之心報道機器之心編輯部RAG 還有存在的必要嗎？要說最近最郁悶的公司，谷歌肯定算得上一個：自家的 Gemini 1.5 剛剛發布，就被 OpenAI 的 Sora 搶盡了風...

閱讀原文

AIGC動態

2年前 (2024)

收藏！萬字長文聊聊LLM Agents的現狀，問題與未來

700個開發硬件免費申請?現金大獎！生成式 AI、機器人 AI、PC AI 三大賽道！AMD Pervasive AI 開發者挑戰賽報名火熱進行中，掃碼了解詳情并報名～導讀本文是知...

閱讀原文

AIGC動態

2年前 (2024)

200萬上下文窗口創飛Gemini 1.5！微軟來砸谷歌場子了（doge）

西風發自凹非寺量子位 | 公眾號 QbitAI谷歌剛刷新大模型上下文窗口長度記錄，發布支持100萬token的Gemini 1.5，微軟就來砸場子了。推出大模型上下文窗口拉...

閱讀原文

AIGC動態

2年前 (2024)

“打假”Sora，谷歌Gemini 1.5 Pro第一波評測出爐｜甲子光年

Gemini 與 Sora 互相傷害。作者｜劉楊楠編輯｜趙健 OpenAI 與谷歌同一天發布的兩款 AI 模型正在“互相傷害”。先是 OpenAI 的 “世界模擬器” Sora 完全搶走了...

閱讀原文

AIGC動態

2年前 (2024)

Gemini 1.5實測：我看Sora一眼假；還有更多驚艷功能

白交發自凹非寺量子位 | 公眾號 QbitAI谷歌の“反擊”來了！ Gemini被Sora搶走的風頭，現在有搶回來的勢頭了。在最新實測中，Gemini 1.5能分析Sora視頻是否A...

閱讀原文

AIGC動態

2年前 (2024)

Pieter Abbeel新工作“大世界模型”：輕松玩轉 1 小時長視頻，一對一QA視頻內容細節

大數據文摘授權轉載自AI科技評論作者：賴文昕編輯：陳彩嫻自3天前Sora發布以來，由圖靈獎得主、Meta首席科學家Yann LeCun提出的“世界模型”又一次引起了廣...

閱讀原文

AIGC動態

2年前 (2024)

Pieter Abbeel 新工作“大世界模型”：輕松玩轉 1 小時長視頻，一對一 QA 視頻內容細節

伯克利發布的“大世界模型”，究竟大在哪里？作者丨賴文昕編輯丨陳彩嫻自3天前Sora發布以來，由圖靈獎得主、Meta首席科學家Yann LeCun提出的“世界模型”又一次...

閱讀原文

AIGC動態

2年前 (2024)

100萬token，一次能分析1小時YouTube視頻，「大世界模型」火了

機器之心報道編輯：陳萍、小舟這項研究為語言模型更好地理解物理世界鋪平了道路。最近幾天，我們接連被谷歌的多模態模型 Gemini 1.5 以及 OpenAI 的視頻生成...

閱讀原文

AIGC動態

2年前 (2024)

港中文聯合MIT提出超長上下文LongLoRA大模型微調算法

大數據文摘受權轉載自將門創投現階段，上下文窗口長度基本上成為了評估LLM能力的硬性指標，上下文的長度越長，代表大模型能夠接受的用戶要求越復雜，近期Ope...

閱讀原文

AIGC動態

2年前 (2024)

今日Arxiv最熱大模型論文：大語言模型真的理解上下文了嗎？新研究揭示驚人發現

夕小瑤科技說原創作者 | 松果探索大型語言模型的上下文理解能力在自然語言處理（ Natural Language Processing,NLP）領域，理解上下文是把握人類語言的關...

閱讀原文

AIGC動態

2年前 (2024)

1…7 8910 11…15