豆包視覺理解模型已經接入豆包App和PC端產品~
原標題:豆包視覺理解模型正式發布:一元處理近 300 張高清圖片,低于行業價格 85%
文章來源:AI前線
內容字數:5273字
字節跳動發布豆包大模型家族,引領AI普惠化浪潮
12月18日,火山引擎Force大會上,字節跳動重磅發布了豆包大模型家族的最新進展,包括視覺理解模型、3D生成模型以及通用模型Pro等多款產品的升級,展現了其在AI領域強大的技術實力和對普惠AI的堅定承諾。
1. 豆包視覺理解模型:低成本,高性能
此次發布的重頭戲是豆包視覺理解模型,其在數學、物理、圖表、代碼等方面展現出強大的推理能力。更令人矚目的是其超低價格:千tokens輸入價格僅為3厘,一元可處理284張720P圖片,比行業價格便宜85%。該模型已接入豆包App和PC端產品,并通過火山引擎開放給企業客戶,大幅降低了大模型應用的門檻。
2. 豆包3D生成模型:賦能虛擬與現實融合
豆包3D生成模型首次亮相,采用3D-DiT等先進算法,生成高質量的3D模型。結合火山引擎與英偉達合作的數字孿生平臺veOmniverse,可高效完成智能訓練、數據合成和數字資產制作,加速虛擬與現實的深度融合。用戶只需輸入文本,即可實時生成3D場景和模型,滿足仿真訓練的多樣化需求。
3. 豆包通用模型Pro:對標GPT-4,價格更低
豆包通用模型Pro已全面對齊GPT-4,但在價格上僅為后者的1/8。在專業知識領域、綜合任務處理能力、指令遵循和推理能力等方面均有顯著提升,甚至在部分復雜任務中表現優于GPT-4。
4. 其他豆包大模型產品升級
豆包音樂模型升級為生成3分鐘完整作品,具備更強的旋律、節奏、和聲控制能力;文生圖模型2.1版本新增“一鍵P圖,一鍵海報”功能,實現精準生成漢字和一句話P圖;未來還將推出更長視頻生成能力的豆包視頻生成模型1.5版和端到端實時語音模型。
5. 豆包大模型的市場表現
截至12月中旬,豆包通用模型日均tokens使用量已超過4萬億,較七個月前增長33倍。豆包大模型已與八成主流汽車品牌合作,并接入到多家手機、PC等智能終端,覆蓋終端設備約3億臺。在企業生產力相關場景的應用也快速增長,展現了強大的市場競爭力。
6. 火山引擎:AI云原生戰略
火山引擎總裁譚待表示,豆包大模型的成功得益于“更強模型、更低成本、更易落地”的發展理念。火山引擎還升級了火山方舟、扣子和HiAgent等平臺產品,并推出新一代計算、網絡、存儲和安全產品,構建AI云原生架構,助力企業高效開發AI應用。
7. 未來展望
字節跳動致力于將豆包大模型打造成為國內最全面、技術最領先的大模型之一,并通過火山引擎的平臺賦能,推動AI技術普惠化,讓AI成為每家企業都能用得起、用得好的普惠科技。
聯系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。