AIGC動態歡迎閱讀
原標題:港中文 128 頁全球首份 Gemini vs?GPT-4V 多模態 PK 報告
關鍵字:報告,模型,能力,視覺,任務
文章來源:AI科技評論
內容字數:13434字
內容摘要:
2023 年 12 月 6 日,谷歌發布了最新一代的通用人工智能大模型 Gemini,并報告在多項測試中取得了最先進的結果,甚至在 MMLU 測試中首次取得了超過人類專家的成績,人工智能似乎進入 Gemini 時代。
直到北京時間上周三晚谷歌才正式開放 Gemini Pro 版本的 API,使得用戶可以親自體驗。Gemini 的實際多模態能力究竟如何呢?是否真如他們技術報告和宣傳視頻中展示的那樣?是否超越了 GPT-4V?和其他開源模型相比又如何呢?
在 Gemini Pro 的 API 開放后不到一周,港中文聯合多加單位共同公布了一份長達 128 頁的評測報告,將 Gemini Pro 與目前最先進的 GPT-4V 進行對比,探索其是否能挑戰 GPT-4V 的在多模態領域的霸主地位,并和最新的開源大模型 SPHNIX 進行比較,揭示開源模型與黑盒系統之間的差距。
論文鏈接:https://arxiv.org/pdf/2312.12436.pdf
項目鏈接:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Mode
原文鏈接:港中文 128 頁全球首份 Gemini vs?GPT-4V 多模態 PK 報告
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...