標簽:任務

谷歌大殺器終于來了,最大規模Gemini震撼發布:真超GPT4,三大版本,手機直接可用

機器之心報道機器之心編輯部時代變了?迄今為止規模最大,能力最強的谷歌大模型來了。當地時間 12 月 6 日,谷歌 CEO 桑達爾?皮查伊官宣 Gemini 1.0 版正式...
閱讀原文

小模型也可以「分割一切」,Meta改進SAM,參數僅為原版5%

機器之心報道編輯:陳萍、蛋醬對于 2023 年的計算機視覺領域來說,「」(Segment Anything Model)是備受關注的一項研究進展。Meta四月份發布的「分割一切模...
閱讀原文

思維鏈提出者Jason Wei:關于大模型的6個直覺

選自 jasonwei.net/blog作者:Jason Wei機器之心編譯編輯:Panda大模型究竟從下一個詞預測任務中學到了什么呢?還記得 Jason Wei 嗎?這位思維鏈的提出者還曾...
閱讀原文

解析 AI Agent 的發展現狀和技術難點 |InfoQ《極客有約》

采訪嘉賓|王元,美國五百強公司 高級數據科學家后 AIGC 時代,AI Agent 無疑是一個新沸點。AI Agent(人工智能體)是一種能夠感知環境、進行決策和執行動作...
閱讀原文

微軟發布Orca2,“式”教會小規模大語言模型如何推理!

夕小瑤科技說 原創作者 | 付奶茶我們都知道在大多數情況下,語言模型的體量和其推理能力之間存在著正相關的關系:模型越大,其處理復雜任務的能力往往越強。...
閱讀原文

通用視覺推理顯現,UC伯克利煉出單一純CV大模型,三位資深學者參與

機器之心報道機器之心編輯部僅靠視覺(像素)模型能走多遠?UC 伯克利、約翰霍普金斯大學的新論文探討了這一問題,并展示了大型視覺模型(LVM)在多種 CV 任...
閱讀原文

全球首個開源多模態醫療基礎模型:人工打分平均超越GPT-4V、支持2D/3D放射影像

機器之心專欄機器之心編輯部本文中,上海交大 上海 AI Lab 發布 Radiology Foundation Model (RadFM),開源 14B 多模態醫療基礎模型,首次支持 2D/3D 放射影...
閱讀原文

橫掃13個視覺語言任務!哈工深發布多模態大模型「九天」,性能直升5%

新智元報道編輯:LRS【新智元導讀】哈工深發布全新多模態大語言模型九天(JiuTian-LION),融合細粒度空間感知和高層語義視覺知識,在13個評測任務上實現了so...
閱讀原文

Meta教你5步學會用Llama2:我見過最簡單的大模型教學

機器之心報道編輯:趙陽本文是 Meta 官網推出的 Llama2 使用教學博客,簡單 5 步教會你如何使用 Llama2。在這篇博客中,Meta 探討了使用 Llama 2 的五個步驟...
閱讀原文

追蹤溯源?可定位源頭模型的AI文本判別器出現了!CMU提出

夕小瑤科技說 原創作者 | 智商掉了一地、Python自從去年底 ChatGPT 發布以來,許多人的工作和生活方式隨之變化。作為創作時代的重要拐點,大型語言模型(LLM...
閱讀原文

用GPT-4V和人類演示訓練機器人:眼睛學會了,手也能跟上

機器之心報道編輯:趙陽微軟提出使用人手運動視頻直接教機器人完成任務的新方法,這種方法使用 GPT-4V 分解視頻中的動作,結合大語言模型生成對應的行為表述...
閱讀原文

專注圖表理解,騰訊、南洋理工等開源圖表羊駝大模型ChartLlama

機器之心專欄機器之心編輯部在圖像理解領域,多模態大模型已經充分展示了其卓越的性能。然而,對于工作中經常需要處理的圖表理解與生成任務,現有的多模態模...
閱讀原文

微軟教小模型推理進階版:Orca 2性能媲美10倍參數模型,已開源

機器之心報道機器之心編輯部站在巨人的肩膀上會讓你看的更遠,而通過讓大規模語言模型來「教」較小規模的語言模型進行推理,也會是事半功倍的效果。如你我所...
閱讀原文

朱松純教授團隊提出通用人工智能測試評級的標準與平臺Tong Test

//人類正在邁入智能時代,其區別于信息時代的顯著特征是大量通用智能體的出現,而通用人工智能作為引領和推動智能時代發展的核心科技,是目前及未來國際人工...
閱讀原文

LLM準確率飆升27%!谷歌DeepMind提出全新「后退一步」提示技術

新智元報道編輯:拉燕【新智元導讀】谷歌DeepMind全新提示技術「Step-Back Prompting」,讓LLM性能拉滿!前段時間,谷歌DeepMind提出了一種全新的「Step-Back...
閱讀原文
1363738394048