標簽:基準

力壓70B Llama 3,Gemma 2成最強開源模型!大佬質疑用榜單prompt微調引全網熱議

新智元報道編輯:喬楊 好困 【新智元導讀】導讀:時隔4個月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的參數擊敗了許多更大規模的模型,甚至超...
閱讀原文

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI更接近現實

劉子煜 投稿量子位 | 公眾號 QbitAI大模型對話能更接近現實了! 不僅可以最多輸入20張圖像,還能支持多達27輪對話。可處理文本+圖像tokens最多18k。 這就是最...
閱讀原文

完全開源!謝賽寧發布最新SOTA多模態模型Cambrian-1,“不與GPT-4V媲美”

夕小瑤科技說 原創作者 | 21# 6月15日,智源大會「多模態大模型」論壇中,紐約大學助理教授謝賽寧從哲學的角度出發,分享了AI是否需要更強的視覺基礎來實現理...
閱讀原文

LeCun謝賽寧首發全新視覺多模態模型,等效1000張A100干翻GPT-4V

新智元報道編輯:編輯部 【新智元導讀】近日,LeCun和謝賽寧等大佬,共同提出了這一種全新的SOTA MLLM——Cambrian-1。開創了以視覺為中心的方法來設計多模態模...
閱讀原文

考考大模型視頻理解能力,中科院人大百川提出新基準合成框架

VideoNIAH團隊 投稿量子位 | 公眾號 QbitAI測試Gemini1.5 Pro、GPT-4o等多模態大模型的新基準來了,針對視頻理解能力的那種。 直接在視頻內容中插入多個無關...
閱讀原文

ACL 2024: ChatGPT栽了!數據標注還得靠人類

夕小瑤科技說 原創作者 | 謝年年 人工智能領域苦于數據標注久已,ChatGPT的出現似乎打破了這個僵局。 早在2023年,蘇黎世大學一篇論文[1]發現,無論成本還是效...
閱讀原文

李沐老師回歸B站!帶著大模型創業成果填坑來了

西風 發自 凹非寺量子位 | 公眾號 QbitAI終于,AI大神李沐回來了!帶著他的大模型創業最新成果—— 一個專門為復雜場景角色扮演設計的大模型,名為Higgs-Llama-...
閱讀原文

AI訓練數據成本高昂,僅剩巨頭玩得起!

點擊上方藍字關注我們“隨著AI訓練數據成本的不斷攀升,僅有資金雄厚的科技巨頭如谷歌和Meta能夠承擔。這導致AI發展日益集中化,小型企業和學術機構難以參與競...
閱讀原文

速度秒掉GPT-4o、22B擊敗Llama 3 70B,Mistral AI開放首個代碼模型

機器之心報道 編輯:杜偉、陳萍開放但禁止商用用途。對標 OpenAI 的法國 AI 獨角獸 Mistral AI 有了新動作:首個代碼大模型 Codestral 誕生了。作為一個專為...
閱讀原文

CoT提出者Jason Wei:大模型評估基準的「」

機器之心報道 機器之心編輯部Jason Wei 是思維鏈提出者,并和 Yi Tay、Jeff Dean 等人合著了關于大模型涌現能力的論文。目前他正在 OpenAI 進行工作。在 CV ...
閱讀原文

谷歌數學版Gemini奧賽難題,堪比人類數學家!

新智元報道編輯:編輯部 【新智元導讀】I/O大會上,谷歌Gemini 1.5 Pro一系列更新讓開發者們再次沸騰。最新技術報告中,最引人注目的一點是,數學專業版1.5 P...
閱讀原文

眾包新玩法!LLM競技場誕生基準測試,嚴格分離學渣學霸

新智元報道編輯:alan 【新智元導讀】最公平的大模型基準測試誕生了!來自LLM競技場,最接近人類偏好,數據新鮮、速度快、成本低,嚴格分離學渣和學霸。大模...
閱讀原文

GPT-4o成為全領域SOTA!基準測試遠超Gemini和Claude,多模態功能遠超GPT-4

新智元報道編輯:編輯部 【新智元導讀】OpenAI半小時的發布會讓很多人第一反應是直呼「失望」,但隨著官網放出更多demo以及更多網友開始試用,大家才發現GPT-...
閱讀原文

谷歌Gemini 1.5技術報告:輕松證明奧數題,Flash版比GPT-4 Turbo快5倍

機器之心報道 編輯:澤南谷歌表示,Gemini 1.5 相比 Claude 3.0和 GPT-4 Turbo 實現了代際提升。 今年 2 月,谷歌上線了多模態大模型 Gemini1.5,通過工程和...
閱讀原文

今日arXiv最熱CV大模型論文:國產開源視覺大模型InternVL 1.5發布,趕超GPT-4V水準

夕小瑤科技說 原創作者 | 墨墨2023年9月,OpenAI發布了多模態大模型GPT-4V,開啟了多模態研究熱潮。短短8個月時間內,閉源模型如Gemini系列, Qwen-VL-Max,開...
閱讀原文
13456712