AIGC動態歡迎閱讀
原標題:生圖超級外掛!賈佳亞團隊提出 VLM 模型 Mini-Gemini,堪比 GPT4+DALLE3 王炸組合
關鍵字:圖像,模型,數據,圖片,能力
文章來源:AI科技評論
內容字數:4774字
內容摘要:
更高清圖像的精確理解、更高質量的訓練數據、更強的圖像解析推理能力,還能結合圖像推理和生成,香港中文大學終身教授賈佳亞團隊提出的這款多模態模型Mini-Gemini堪稱絕絕子,相當于開源社區的GPT4+DALLE3的王炸組合!
Mini-Gemini還提供了2B小杯到34B的超大杯,最強模型在多個指標上相比Google Gemini Pro甚至GPT-4V都不遑多讓。目前,Mini-Gemini從代碼、模型、到數據已全部開源,登上了PaperWithCode熱榜。
Mini-Gemini線上Demo也已發布,超會玩梗,一起來體驗下!
Mini-Gemini Demo放出后受到廣大網友關注,一番“品嘗”后,他們認為Mini-Gemini跟商業模型差不了多少!目前,絕大多數多模態模型僅支持低分辨率圖像輸入和文字輸出,而在實際場景中,許多任務都需要對高清圖像進行解析,并用圖像的形式進行展現。
如上圖所示,Mini-Gemini不僅能夠根據圖片對做面包的過程進行手把手教學,也能夠準確將不同電腦品種根據圖片中的各種參數進行對比。網友表示:媽媽再也不用擔心我的生活了。
更重要的是,Mini-Gemi
原文鏈接:生圖超級外掛!賈佳亞團隊提出 VLM 模型 Mini-Gemini,堪比 GPT4+DALLE3 王炸組合
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...