豆包視覺理解模型正式發(fā)布:一元處理近 300 張高清圖片,低于行業(yè)價(jià)格 85%
豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品~
原標(biāo)題:豆包視覺理解模型正式發(fā)布:一元處理近 300 張高清圖片,低于行業(yè)價(jià)格 85%
文章來源:AI前線
內(nèi)容字?jǐn)?shù):5273字
字節(jié)跳動(dòng)發(fā)布豆包大模型家族,引領(lǐng)AI普惠化浪潮
12月18日,火山引擎Force大會(huì)上,字節(jié)跳動(dòng)重磅發(fā)布了豆包大模型家族的最新進(jìn)展,包括視覺理解模型、3D生成模型以及通用模型Pro等多款產(chǎn)品的升級(jí),展現(xiàn)了其在AI領(lǐng)域強(qiáng)大的技術(shù)實(shí)力和對(duì)普惠AI的堅(jiān)定承諾。
1. 豆包視覺理解模型:低成本,高性能
此次發(fā)布的重頭戲是豆包視覺理解模型,其在數(shù)學(xué)、物理、圖表、代碼等方面展現(xiàn)出強(qiáng)大的推理能力。更令人矚目的是其超低價(jià)格:千tokens輸入價(jià)格僅為3厘,一元可處理284張720P圖片,比行業(yè)價(jià)格便宜85%。該模型已接入豆包App和PC端產(chǎn)品,并通過火山引擎開放給企業(yè)客戶,大幅降低了大模型應(yīng)用的門檻。
2. 豆包3D生成模型:賦能虛擬與現(xiàn)實(shí)融合
豆包3D生成模型首次亮相,采用3D-DiT等先進(jìn)算法,生成高質(zhì)量的3D模型。結(jié)合火山引擎與英偉達(dá)合作的數(shù)字孿生平臺(tái)veOmniverse,可高效完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,加速虛擬與現(xiàn)實(shí)的深度融合。用戶只需輸入文本,即可實(shí)時(shí)生成3D場景和模型,滿足仿真訓(xùn)練的多樣化需求。
3. 豆包通用模型Pro:對(duì)標(biāo)GPT-4,價(jià)格更低
豆包通用模型Pro已全面對(duì)齊GPT-4,但在價(jià)格上僅為后者的1/8。在專業(yè)知識(shí)領(lǐng)域、綜合任務(wù)處理能力、指令遵循和推理能力等方面均有顯著提升,甚至在部分復(fù)雜任務(wù)中表現(xiàn)優(yōu)于GPT-4。
4. 其他豆包大模型產(chǎn)品升級(jí)
豆包音樂模型升級(jí)為生成3分鐘完整作品,具備更強(qiáng)的旋律、節(jié)奏、和聲控制能力;文生圖模型2.1版本新增“一鍵P圖,一鍵海報(bào)”功能,實(shí)現(xiàn)精準(zhǔn)生成漢字和一句話P圖;未來還將推出更長視頻生成能力的豆包視頻生成模型1.5版和端到端實(shí)時(shí)語音模型。
5. 豆包大模型的市場表現(xiàn)
截至12月中旬,豆包通用模型日均tokens使用量已超過4萬億,較七個(gè)月前增長33倍。豆包大模型已與八成主流汽車品牌合作,并接入到多家手機(jī)、PC等智能終端,覆蓋終端設(shè)備約3億臺(tái)。在企業(yè)生產(chǎn)力相關(guān)場景的應(yīng)用也快速增長,展現(xiàn)了強(qiáng)大的市場競爭力。
6. 火山引擎:AI云原生戰(zhàn)略
火山引擎總裁譚待表示,豆包大模型的成功得益于“更強(qiáng)模型、更低成本、更易落地”的發(fā)展理念。火山引擎還升級(jí)了火山方舟、扣子和HiAgent等平臺(tái)產(chǎn)品,并推出新一代計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)和安全產(chǎn)品,構(gòu)建AI云原生架構(gòu),助力企業(yè)高效開發(fā)AI應(yīng)用。
7. 未來展望
字節(jié)跳動(dòng)致力于將豆包大模型打造成為國內(nèi)最全面、技術(shù)最領(lǐng)先的大模型之一,并通過火山引擎的平臺(tái)賦能,推動(dòng)AI技術(shù)普惠化,讓AI成為每家企業(yè)都能用得起、用得好的普惠科技。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。