標簽：基準

力壓70B Llama 3，Gemma 2成最強開源模型！大佬質疑用榜單prompt微調引全網熱議

新智元報道編輯：喬楊好困【新智元導讀】導讀：時隔4個月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上，以27B的參數擊敗了許多更大規模的模型，甚至超...

閱讀原文

AIGC動態

1年前 (2024)

一次可輸入多張圖像，還能多輪對話！最新開源數據集，讓AI更接近現實

劉子煜投稿量子位 | 公眾號 QbitAI大模型對話能更接近現實了！不僅可以最多輸入20張圖像，還能支持多達27輪對話。可處理文本+圖像tokens最多18k。這就是最...

閱讀原文

AIGC動態

1年前 (2024)

完全開源！謝賽寧發布最新SOTA多模態模型Cambrian-1，“不與GPT-4V媲美”

夕小瑤科技說原創作者 | 21# 6月15日，智源大會「多模態大模型」論壇中，紐約大學助理教授謝賽寧從哲學的角度出發，分享了AI是否需要更強的視覺基礎來實現理...

閱讀原文

AIGC動態

1年前 (2024)

LeCun謝賽寧首發全新視覺多模態模型，等效1000張A100干翻GPT-4V

新智元報道編輯：編輯部【新智元導讀】近日，LeCun和謝賽寧等大佬，共同提出了這一種全新的SOTA MLLM——Cambrian-1。開創了以視覺為中心的方法來設計多模態模...

閱讀原文

AIGC動態

1年前 (2024)

考考大模型視頻理解能力，中科院人大百川提出新基準合成框架

VideoNIAH團隊投稿量子位 | 公眾號 QbitAI測試Gemini1.5 Pro、GPT-4o等多模態大模型的新基準來了，針對視頻理解能力的那種。直接在視頻內容中插入多個無關...

閱讀原文

AIGC動態

1年前 (2024)

ACL 2024: ChatGPT栽了！數據標注還得靠人類

夕小瑤科技說原創作者 | 謝年年人工智能領域苦于數據標注久已，ChatGPT的出現似乎打破了這個僵局。早在2023年,蘇黎世大學一篇論文[1]發現，無論成本還是效...

閱讀原文

AIGC動態

1年前 (2024)

李沐老師回歸B站！帶著大模型創業成果填坑來了

西風發自凹非寺量子位 | 公眾號 QbitAI終于，AI大神李沐回來了！帶著他的大模型創業最新成果—— 一個專門為復雜場景角色扮演設計的大模型，名為Higgs-Llama-...

閱讀原文

AIGC動態

1年前 (2024)

AI訓練數據成本高昂，僅剩巨頭玩得起！

點擊上方藍字關注我們“隨著AI訓練數據成本的不斷攀升，僅有資金雄厚的科技巨頭如谷歌和Meta能夠承擔。這導致AI發展日益集中化，小型企業和學術機構難以參與競...

閱讀原文

AIGC動態

1年前 (2024)

速度秒掉GPT-4o、22B擊敗Llama 3 70B，Mistral AI開放首個代碼模型

機器之心報道編輯：杜偉、陳萍開放但禁止商用用途。對標 OpenAI 的法國 AI 獨角獸 Mistral AI 有了新動作：首個代碼大模型 Codestral 誕生了。作為一個專為...

閱讀原文

AIGC動態

1年前 (2024)

CoT提出者Jason Wei：大模型評估基準的「」

機器之心報道機器之心編輯部Jason Wei 是思維鏈提出者，并和 Yi Tay、Jeff Dean 等人合著了關于大模型涌現能力的論文。目前他正在 OpenAI 進行工作。在 CV ...

閱讀原文

AIGC動態

1年前 (2024)

谷歌數學版Gemini奧賽難題，堪比人類數學家！

新智元報道編輯：編輯部【新智元導讀】I/O大會上，谷歌Gemini 1.5 Pro一系列更新讓開發者們再次沸騰。最新技術報告中，最引人注目的一點是，數學專業版1.5 P...

閱讀原文

AIGC動態

2年前 (2024)

眾包新玩法！LLM競技場誕生基準測試，嚴格分離學渣學霸

新智元報道編輯：alan 【新智元導讀】最公平的大模型基準測試誕生了！來自LLM競技場，最接近人類偏好，數據新鮮、速度快、成本低，嚴格分離學渣和學霸。大模...

閱讀原文

AIGC動態

2年前 (2024)

GPT-4o成為全領域SOTA！基準測試遠超Gemini和Claude，多模態功能遠超GPT-4

新智元報道編輯：編輯部【新智元導讀】OpenAI半小時的發布會讓很多人第一反應是直呼「失望」，但隨著官網放出更多demo以及更多網友開始試用，大家才發現GPT-...

閱讀原文

AIGC動態

2年前 (2024)

谷歌Gemini 1.5技術報告：輕松證明奧數題，Flash版比GPT-4 Turbo快5倍

機器之心報道編輯：澤南谷歌表示，Gemini 1.5 相比 Claude 3.0和 GPT-4 Turbo 實現了代際提升。今年 2 月，谷歌上線了多模態大模型 Gemini1.5，通過工程和...

閱讀原文

AIGC動態

2年前 (2024)

今日arXiv最熱CV大模型論文：國產開源視覺大模型InternVL 1.5發布，趕超GPT-4V水準

夕小瑤科技說原創作者 | 墨墨2023年9月，OpenAI發布了多模態大模型GPT-4V，開啟了多模態研究熱潮。短短8個月時間內，閉源模型如Gemini系列, Qwen-VL-Max，開...

閱讀原文

AIGC動態

2年前 (2024)

1…3 456 7…12