標簽:任務

CMU權威對比Gemini,GPT-3和Mistral8×7B!GPT-3.5依舊拿捏Gemini,開源模型差距依然不小

新智元報道編輯:山令alan 【新智元導讀】谷歌發布Gemini以后,一直宣稱Gemini Pro要優于GPT-3.5,而CMU的研究人員通過自己實測,給大家來了一個客觀中立第三...
閱讀原文

李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%

新智元報道編輯:桃子 【新智元導讀】激發大模型解決復雜問題的重要技術之一CoT,如今要被顛覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代碼鏈」(CoC),...
閱讀原文

清華特獎焦劍濤大模型創業:突破GPT-4工具使用能力,搞開源種子輪融資七千萬

魚羊 豐色 發自 凹非寺量子位 | 公眾號 QbitAI開源模型終于開始超越GPT-4了。 兩位清華校友打造,在GPT-4核心優勢之一使用工具上實現超越。 連HuggingFace CE...
閱讀原文

騰訊發布實體任務規劃基準,GPT-4V也頻頻出錯!邁向大模型與物理世界交互!

夕小瑤科技說 原創作者 | 智商掉了一地、Python多模態大型語言模型(MLLM)目前主要通過數字化的方式與信息世界進行交互,涉及自然語言處理、計算機視覺和多...
閱讀原文

大模型竟然能玩手機了,還能用軟件修圖:「AppAgent」會成為2024年的新趨勢嗎?

機器之心專欄 機器之心編輯部這就是2024年的新趨勢嗎?近日,一項名為 AppAgent 的創新技術引起了廣泛關注。 簡單來說,AppAgent 的智能代理能力可以用于操作...
閱讀原文

化身反編譯好手!微軟用大語言模型直接解讀二進制代碼!

夕小瑤科技說 原創作者 | 付奶茶、Python奶茶聽說LLMs可以直接處理二進制代碼了?近期一項研究展示了大語言模型(LLMs)分析二進制代碼并自動生成摘要的能力...
閱讀原文

通往具身通用智能:如何讓機器從自然模態中學習到世界模型?

目前的人工智能系統雖然強大,卻常常缺乏人類和動物的常識和靈活推理能力。人工智能研究的最終目標,是讓機器能夠像人類一樣思考、學習并解決各種任務,實現...
閱讀原文

一文說盡「大模型推理」!12家高校機構聯合發布150頁報告,綜述750篇論文

新智元報道編輯:LRS 好困 【新智元導讀】全面綜述近750篇「基礎模型推理」論文,聚焦于各種推理任務、方法論和基準測試的最新進展,詳細闡述大模型在各種推...
閱讀原文

谷歌Gemini扳回一局!多模態能力和GPT-4V不分伯仲|港中文128頁全面測評報告

happy投稿量子位 | 公眾號 QbitAI谷歌扳回一局! 在Gemini開放API不到一周的時間,港中文等機構就完成評測,聯合發布了多達128頁的報告,結果顯示: 在37個視...
閱讀原文

CMU評測:Gemini Pro相比GPT3.5,全線潰敗!代碼公開可復現

? 夕小瑤科技說 原創作者 | 謝年年、python前段時間谷歌DeepMind推出了號稱是谷歌史上功能最強大、最通用的多模態模型Gemini 1.0! Gemini 1.0共有Gemini Ult...
閱讀原文

谷歌Gemini技術報告出爐,作者多達900余人

機器之心報道 機器之心編輯部從此以后,Google Scholar 數據該出問題了。備受期待的谷歌 Gemini 技術報告完整版,今天終于出爐了。兩周前,人們興奮于谷歌提...
閱讀原文

清華陳建宇:當人形機器人成為人類替身,是一場怎樣的?

?人形機器人是當前最炙手可熱的方向之一。談到人形機器人的最終局,清華交叉信息研究院助理教授、星動紀元創始人陳建宇說到,在未來人形機器人很可能成為人類...
閱讀原文

Gemini Pro還不如GPT-3.5,CMU深入對比研究:保證公平透明可重復

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI谷歌Gemini實力到底如何?卡耐基梅隆大學來了場專業客觀第三方比較。 為保證公平,所有模型使用相同的提示和生成參數...
閱讀原文

OpenAI 官方 Prompt 工程指南:寫好 Prompt 的六個策略

其實一直有很多人問我,Prompt 要怎么寫效果才好,有沒有模板。 我每次都會說,能清晰的表達你的想法,才是最重要的,各種技巧都是其次。但是,我還是希望發...
閱讀原文

Nature:2024 年值得關注的科學,GPT-5、嫦娥六號、超級計算機等上榜

來源:學術頭條 2023 年是一個不平凡之年。 在 2023 年即將結束之際,權威科學期刊Nature發布了2024 年值得關注的科學事件,包括令人期待的 GPT-5、被細菌感...
閱讀原文
1333435363748