標簽:語言
字節跳動李航:對語言大模型的若干觀察和思考
機器之心專欄作者:ByteDance Research負責人李航本文闡述筆者對 LLM 的一些看法,主要觀點如下:ChatGPT 的突破主要在于規模帶來的質變和模型調教方式的發明...
強化學習與視覺語言模型之間的碰撞,UC伯克利提出語言獎勵調節LAMP框架
大數據文摘授權轉載自將門創投作者:seven_在強化學習(RL)領域,一個重要的研究方向是如何巧妙的設計模型的獎勵機制,傳統的方式是設計手工獎勵函數,并根...
開源標桿!最強中英雙語大模型來了,340億參數,超越 Llama2-70B等所有開源模型
金磊 發自 凹非寺量子位 | 公眾號 QbitAI開源界最強的中英雙語大模型,悟道·天鷹 34B,來了!有多強?一言蔽之:中英綜合能力、邏輯推理能力等,全面超越 Lla...
智源扔出大模型“全家桶”!推最強開源中英雙語LLM,趕超Llama 2
智源推最強開源中英雙語大模型!340億參數超越Llama 2-70B。編輯|luna智東西10月12日報道,今日,智源研究院宣布悟道·天鷹Aquila大語言模型系列全面升級到Aqu...
在圖像、視頻生成上,語言模型首次擊敗擴散模型,tokenizer是關鍵
機器之心報道編輯:張倩、陳萍為什么語言模型在視覺生成方面落后于擴散模型?來自谷歌、CMU 的研究表明,tokenizer 是關鍵。大型語言模型(LLM 或 LM)一開始...
挑戰GPT-4V!清華唐杰&智譜開源多模態14邊形戰士,在線可玩
夢晨 發自 凹非寺量子位 | 公眾號 QbitAI看看這張圖中有幾個房子?如果你回答3個,就和GPT-4V的答案一樣。但是最新開源的國產多模態模型CogVLM-17B,就能看出...
兩行代碼解決大語言模型對話局限!港中文賈佳亞團隊聯合 MIT 發布超長文本擴展技術
代碼和Demo地址:https://github.com/dvlab-research/LongLoRA論文地址:https://arxiv.org/pdf/2309.12307.pdf中途迷失、模型偷懶、上下文越長大模型越笨......
Hugging Face 大語言模型優化技術
作者 | Sergio De Simone 譯者 | 明知山 策劃 | 丁曉昀 大語言模型的生產部署存在兩個主要的挑戰,一個是需要大量的參數,一個是需要處理非常長的用于表示上...
賈佳亞團隊開源全球首個70B長文本大語言模型,讀論文看小說直接ProMax
金磊 發自 凹非寺量子位 | 公眾號 QbitAI家人們,苦長文本久矣的大語言模型(LLM),現在終于有解法了!就在最近,香港中文大學賈佳亞團隊聯合MIT宣布了一項...
76頁綜述+300余篇參考文獻,天大團隊全面介紹大語言模型對齊技術
機器之心專欄作者:熊德意教授團隊天大自然語言處理團隊從更廣泛的 AI 對齊視角,審視大語言模型對齊技術,并從多個角度進行深入討論。近日,天津大學熊德意...
斯坦福NLP課程XCS224U視頻全部放出,干貨滿滿,速來聽講
機器之心報道編輯:大盤雞50 個視頻任君學習!從對話智能體到搜索查詢,自然語言理解(NLP)是當今許多最令人興奮的技術的基礎。如何建立這些模型來高效、可...
400萬token,大模型推理飆升22倍!清華校友爆火一作,GitHub狂攬1.8k星
新智元報道編輯:潤【新智元導讀】大模型上下文限制不是事兒?大語言模型的上下文長度限制從此不存在了?!Meta、MIT、CMU的研究者最近剛剛發表了一篇論文,...
未來的人工智能語言,是 Rust 還是 Mojo ?
作者 | 張漢東本文轉載自 覺學社 公眾號原文地址:https://mp.weixin.qq.co...7ShPQKn10tTpHyw9 月 7 日,Modular 公司宣布正式發布 Mojo:Mojo 現在已經開放...
西交、清華等發布多模態大模型,有望成為「DALL·E 4」技術路線?和AI一起「白日作夢」
新智元報道編輯:LRS【新智元導讀】DALL·E 3讓我們看到了生成+理解的大語言模型的魔力。就在其發布的同一天,國內的一個新工作引起了社區的關注:DreamLLM。D...
GPT-4太燒錢!微軟撐不住了,被曝悄悄啟動Plan B
微軟撥上千塊GPU訓練自研語言模型,或引入必應聊天。?????????編譯|ZeR0編輯|漠影智東西9月27日消息,據The Information昨日報道,微軟這廂高調將GPT-4融入自...