賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復(fù)現(xiàn)數(shù)學(xué)函數(shù)
AIGC動態(tài)歡迎閱讀
原標題:賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復(fù)現(xiàn)數(shù)學(xué)函數(shù)
關(guān)鍵字:模型,圖像,圖片,數(shù)據(jù),地址
文章來源:新智元
內(nèi)容字數(shù):5573字
內(nèi)容摘要:
新智元報道編輯:編輯部
【新智元導(dǎo)讀】賈佳亞團隊提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸組合,一上線就刷爆了多模態(tài)任務(wù)榜單!讀得懂梗圖,做得了學(xué)術(shù),用代碼就能復(fù)現(xiàn)數(shù)學(xué)函數(shù)圖。刷爆多模態(tài)任務(wù)榜單,超強視覺語言模型Mini-Gemini來了!
效果堪稱是開源社區(qū)版的GPT-4+DALL-E 3王炸組合。
不僅如此,這款由港中文終身教授賈佳亞團隊提出的多模態(tài)模型,一經(jīng)發(fā)布便登上了PaperWithCode熱榜。
Demo地址: http://103.170.5.190:7860/
論文地址:https://arxiv.org/pdf/2403.18814.pdf
具體來說,Mini-Gemini提供了2B小杯到34B的超大杯的不同選擇。
憑借超強的圖文理解力,Mini-Gemini在多個指標上,直接媲美Gemini Pro,GPT-4V。
目前,研究團隊將Mini-Gemini的代碼、模型、數(shù)據(jù)全部開源。
更有意思的是,超會玩梗的Mini-Gemini線上Demo已經(jīng)發(fā)布,人人皆可上手試玩。
Mini-Gemini Demo放出后受到廣大網(wǎng)友關(guān)注,一番「嘗
原文鏈接:賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復(fù)現(xiàn)數(shù)學(xué)函數(shù)
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。