AIGC動態歡迎閱讀
原標題:賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復現數學函數
關鍵字:模型,圖像,圖片,數據,地址
文章來源:新智元
內容字數:5573字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】賈佳亞團隊提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸組合,一上線就刷爆了多模態任務榜單!讀得懂梗圖,做得了學術,用代碼就能復現數學函數圖。刷爆多模態任務榜單,超強視覺語言模型Mini-Gemini來了!
效果堪稱是開源社區版的GPT-4+DALL-E 3王炸組合。
不僅如此,這款由港中文終身教授賈佳亞團隊提出的多模態模型,一經發布便登上了PaperWithCode熱榜。
Demo地址: http://103.170.5.190:7860/
論文地址:https://arxiv.org/pdf/2403.18814.pdf
具體來說,Mini-Gemini提供了2B小杯到34B的超大杯的不同選擇。
憑借超強的圖文理解力,Mini-Gemini在多個指標上,直接媲美Gemini Pro,GPT-4V。
目前,研究團隊將Mini-Gemini的代碼、模型、數據全部開源。
更有意思的是,超會玩梗的Mini-Gemini線上Demo已經發布,人人皆可上手試玩。
Mini-Gemini Demo放出后受到廣大網友關注,一番「嘗
原文鏈接:賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復現數學函數
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...