標簽:語言

特約文章丨大語言模型的知識沖突:成因、根源與展望

文/李興明,胡慶擁摘 要: 大語言模型在實際應用場景中經常面臨知識沖突的問題,主要包括上下文 - 記憶知識沖突、多源上下文知識沖突和記憶內知識沖突。本文...
閱讀原文

大語言模型如何助力藥物開發? 哈佛 George Church Lab 最新綜述

文章鏈接: https://arxiv.org/abs/2409.04481 大語言模型因其展現出類人般的推理、工具使用和問題解決能力而備受矚目,此外,它在化學、生物學等專業領域也展...
閱讀原文

萬字長文解析OpenAI o1 Self-Play RL技術路線

來源:AI大模型實驗室 OpenAI 的 Self-Play RL 新模型 o1 最近交卷,直接引爆了關于對于 Self-Play 的討論。在數理推理領域獲得了傲人的成績,同時提出了 tra...
閱讀原文

在大語言模型中分離語言和思想

來源:清熙 作者: Kyle Mahowald* 德克薩斯大學奧斯汀分校 mahowald@utexas.edu Anna A. Ivanova* 佐治亞理工學院 a.ivanova@gatech.edu Idan A. Blank,加...
閱讀原文

KG+LM超越傳統架構!海德堡提出全新圖語言模型GLM | ACL 2024

新智元報道編輯:alan 【新智元導讀】近日,來自海德堡大學的研究人員推出了圖語言模型 (GLM),將語言模型的語言能力和知識圖譜的結構化知識,統一到了同一種...
閱讀原文

全球開源大模型新王!阿里Qwen2.5來了,性能跨量級超Llama3.1

通義千問Qwen下載量突破4000萬,“產仔”超5萬個。 作者|三北 編輯|漠影 云計算“春晚”云棲大會開幕,通義千問大模型再次燃爆全場! 智東西9月19日杭州報道,今...
閱讀原文

強化學習成為OpenAI o1靈魂,速來學習下Self-play增強大模型

在機器學習尤其是強化學習領域,自我博弈(Self-play)是一種非常重要的學習策略。即使 AI 或者智能體沒有明確的對手或者沒有外部環境提供額外信息,也能通過...
閱讀原文

「LLM」這個名字不好,Karpathy認為不準確、馬斯克怒批太愚蠢

機器之心報道 編輯:陳陳LLM 應該改名嗎?你怎么看。在 AI 領域,幾乎每個人都在談論大型語言模型,其英文全稱為 Large Language Models,簡寫為 LLM。 因為 ...
閱讀原文

螞蟻自研知識增強大模型服務框架KAG,可顯著提升知識推理準確率

機器之心發布 機器之心編輯部近日,在 2024 Inclusion?外灘大會 “超越平面思維,圖計算讓 AI 洞悉復雜世界” 見解論壇上,螞蟻集團知識圖譜負責人梁磊分享了 ...
閱讀原文

揭開OpenAI草莓模型神秘面紗——重塑大語言模型的邏輯能力

OpenAI即將發布“草莓”模型 來源:medium 來源:智源社區 編輯:李夢佳 據報道,OpenAI計劃在未來兩周內發布其新的AI模型Strawberry(草莓)。據 Seeking Alph...
閱讀原文

字節跳動馮佳時:大語言模型在計算機視覺領域的應用、問題和我們的解法

演講嘉賓|馮佳時 編輯 |蔡芳芳 策劃 | AICon 全球人工智能開發與應用大會 近年來,大語言模型 (LLMs) 在文本理解與生成領域取得了顯著進展。然而,LLMs 在...
閱讀原文

名場面來了,李云龍、徐江、王多魚同臺飆戲,背后是小紅書的AI

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

整合 200 多項相關研究,大模型「終生學習」最新綜述來了

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

通向AGI之路|人工智能史上最重磅的19篇論文,系統展示AI如何從象牙塔走進生活!

來源:AI異類弗蘭克 身邊有人說,AI好像是前兩年突然火起來的,一下子就成了我們今天熟悉的產品的模樣。 2022年11月,ChatGPT橫空出世,如驚雷。只是,雷從何...
閱讀原文

通義千問開源視覺語言模型 Qwen2-VL,可理解 20 分鐘以上視頻

整理 | 褚杏娟 2023 年 8 月,通義千問開源第一代視覺語言理解模型 Qwen-VL,成為開源社區最受歡迎的多模態模型之一。短短一年內,模型下載量突破 1000 萬次...
閱讀原文
12345629