谷歌Gemini 1.5模型來了！突破100萬個(gè)tokens，能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布智東西

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：谷歌Gemini 1.5模型來了！突破100萬個(gè)tokens，能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】
關(guān)鍵字：報(bào)告,模型,上下文,政策,窗口
文章來源：智東西
內(nèi)容字?jǐn)?shù)：5152字

內(nèi)容摘要：

一次能處理1小時(shí)視頻、11小時(shí)音頻、超過3萬行代碼。
編譯|ZeR0
編輯|漠影
智東西2月16日?qǐng)?bào)道，谷歌昨夜發(fā)布其大模型矩陣的最新力作——Gemini 1.5，并將上下文窗口長(zhǎng)度擴(kuò)展到100萬個(gè)tokens。
Gemini 1.5 Pro達(dá)到了與1.0 Ultra相當(dāng)?shù)馁|(zhì)量，同時(shí)使用了更少的計(jì)算。該模型在長(zhǎng)語(yǔ)境理解方面取得突破，能夠顯著增加模型可處理的信息量——持續(xù)運(yùn)行多達(dá)100萬個(gè)tokens，實(shí)現(xiàn)迄今任何大型基礎(chǔ)模型中最長(zhǎng)的上下文窗口。
這意味著Gemini 1.5 Pro可一次處理大量的信息——包括1小時(shí)的視頻、11小時(shí)的音頻、超過3萬行代碼或超過70萬字的代碼庫(kù)。
從今天開始，谷歌將通過AI Studio和Vertex AI向開發(fā)者和企業(yè)客戶提供Gemini 1.5 Pro的有限預(yù)覽版。
此外，谷歌透露其在研究中還成功測(cè)試了多達(dá)1000萬個(gè)tokens。
本文福利：58頁(yè)《Gemini 1.5技術(shù)報(bào)告》，可在公眾號(hào)欄回復(fù)關(guān)鍵詞【智東西408】獲取。
01.
基于Transformer和MoE架構(gòu)，
100萬個(gè)tokens上下文窗口
谷歌DeepMind首席執(zhí)行官戴米斯·

原文鏈接：谷歌Gemini 1.5模型來了！突破100萬個(gè)tokens，能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】

聯(lián)系作者

文章來源：智東西
作者微信：zhidxcom
作者簡(jiǎn)介：智能產(chǎn)業(yè)新媒體！智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展，和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革，服務(wù)產(chǎn)業(yè)升級(jí)。

閱讀原文