標簽:知乎
邁向復現 OpenAI o1 的一小步:Steiner 開源模型階段性進展報告
講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀作者為季逸超 原文來自...
人在知乎,被AI總結了
金磊 發自 凹非寺量子位 | 公眾號 QbitAI只是閑逛了下知乎,真是有被 AI 嚇震驚到。 事情是這樣的。 量子位公眾號每天推送的文章,都會順手同步到知乎上;而...
萬字長文梳理LLM+RL(HF)的脈絡
講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀作者為王小惟 Weixun ...
LLM實踐系列-數據去重之Simhash&Minhash分析與實現
講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~今天給大家帶來知乎@真中合...
北大校友張益唐:會將“朗道-西格爾零點猜想”徹底完成
來源:數學與通識 10月15日,傳奇數學家張益唐在知乎上發表文章與年輕人交流,首次講述了此前從未公開過的諸多往事:小時候讀過的介紹俄羅斯科學家羅蒙諾索夫...
訓練視覺語言模型VLM的經驗
講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀作者為lym 原文來自知...
長序列(Long Context)大模型筆記
導讀作者為Rooters 原文來自知乎,地址:https://zhuanlan.zhihu.com/p/926602895 本文只做學術/技術分享,如有侵權,聯系刪文。記錄下過去一年業界長序列LLM...
OpenAI o1能否支撐AGI的新Scaling?
導讀作者為mackler 原文來自知乎,地址:https://zhuanlan.zhihu.com/p/730982539 本文只做學術/技術分享,如有侵權,聯系刪文。OpenAI o1的推出帶來了一波新...
LLM實踐系列-詳談Tokenizer訓練細節
今天給大家帶來知乎@真中合歡的一篇文章,《LLM實踐--Tokenizer訓練》。 知乎:https://zhuanlan.zhihu.com/p/739078635 經過了數據收集、篩選、去重,馬上就...
10年后手機有多科幻?清華孫茂松:人手一個超級大腦,診病翻譯搞研發
新智元報道編輯:編輯部 HYZ 【新智元導讀】十年后的AI手機,能有多科幻?AI已成為每個人生活中,不可或缺的一部分。從個人助理、醫療診斷、到產品研發等領域...
致敬小鎮做題家的OpenAI o1
OAI的草莓從去年11月開始炒作Q*, 已經預熱了快一年了, 似乎伴隨著最近Cursor+Claude的壓力, 以及最近一輪OAI融資, 把o1放出來了. 本以為是給微軟Copilot:Wave...
如何提升角色扮演大模型的擬人能力?
GTIC 2024中國AI PC創新峰會將于10月11日,在2024上海國際消費電子展TechG同期舉辦。聯想集團首席研究員顏毅強、榮耀終端有限公司PC產品研發系統部部長席迎軍...
10個AI驅動的小產品,展現100種創新力量|甲子光年
在S創上海2024大會,智能、高效、具有人文關懷的AI產品,正在不斷涌現。作者|八度?? 編輯|王博 2024年9月20日至21日,上海西岸藝術中心A館迎來了S創上海202...
如何從零訓練多模態大模型(預訓練方向)
開講預約導讀原文來自知乎,作者為HelloWorld,標題為《LLaVA(六)訓練你自己的多模態模型》。作者詳細介紹了如何從零訓練LLaVA v1.5多模態模型,包括特征對...
知乎高贊:從0到1做大語言模型Pretrain的經驗
開講預約導讀原文來自知乎,作者為ybp,標題為《LLM訓練-pretrain》。作者詳細介紹了如何從零到一進行 pretrain 工作,分為背景篇、數據篇、訓練篇、評估篇和...