谷歌Gemini 1.5模型來(lái)了!突破100萬(wàn)個(gè)tokens,能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:谷歌Gemini 1.5模型來(lái)了!突破100萬(wàn)個(gè)tokens,能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】
關(guān)鍵字:報(bào)告,模型,上下文,政策,窗口
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):5152字
內(nèi)容摘要:
一次能處理1小時(shí)視頻、11小時(shí)音頻、超過(guò)3萬(wàn)行代碼。
編譯|ZeR0
編輯|漠影
智東西2月16日?qǐng)?bào)道,谷歌昨夜發(fā)布其大模型矩陣的最新力作——Gemini 1.5,并將上下文窗口長(zhǎng)度擴(kuò)展到100萬(wàn)個(gè)tokens。
Gemini 1.5 Pro達(dá)到了與1.0 Ultra相當(dāng)?shù)馁|(zhì)量,同時(shí)使用了更少的計(jì)算。該模型在長(zhǎng)語(yǔ)境理解方面取得突破,能夠顯著增加模型可處理的信息量——持續(xù)運(yùn)行多達(dá)100萬(wàn)個(gè)tokens,實(shí)現(xiàn)迄今任何大型基礎(chǔ)模型中最長(zhǎng)的上下文窗口。
這意味著Gemini 1.5 Pro可一次處理大量的信息——包括1小時(shí)的視頻、11小時(shí)的音頻、超過(guò)3萬(wàn)行代碼或超過(guò)70萬(wàn)字的代碼庫(kù)。
從今天開(kāi)始,谷歌將通過(guò)AI Studio和Vertex AI向開(kāi)發(fā)者和企業(yè)客戶(hù)提供Gemini 1.5 Pro的有限預(yù)覽版。
此外,谷歌透露其在研究中還成功測(cè)試了多達(dá)1000萬(wàn)個(gè)tokens。
本文福利:58頁(yè)《Gemini 1.5技術(shù)報(bào)告》,可在公眾號(hào)欄回復(fù)關(guān)鍵詞【智東西408】獲取。
01.
基于Transformer和MoE架構(gòu),
100萬(wàn)個(gè)tokens上下文窗口
谷歌DeepMind首席執(zhí)行官戴米斯·
原文鏈接:谷歌Gemini 1.5模型來(lái)了!突破100萬(wàn)個(gè)tokens,能處理1小時(shí)視頻【附58頁(yè)技術(shù)報(bào)告】
聯(lián)系作者
文章來(lái)源:智東西
作者微信:zhidxcom
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專(zhuān)注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。