標簽:算法

李開復首次分享零一萬物大模型方,并表示十年不變現|甲子光年

AI 2.0時代燒錢邏輯不再適用。作者|趙健 今天,大模型初創公司零一萬物宣布了一系列大模型與產品更新: 在模型層,零一萬物發布了千億參數的Yi-Large閉源模...
閱讀原文

人類偏好就是尺!SPPO對齊技術讓大語言模型左右互搏、自我博弈

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

成立2年產出280篇論文,一個頂尖數學家兼億萬富翁和他打造的新型“科學帝國”|吉姆·西蒙斯(1938-2024)

來源 星空雜談(XingKongZaTan) 撰文 D.T. Max 編譯 張一葦 編輯 魏瀟 編者按: 當地時間 2024 年 5 月 10 日,傳奇數學家、慈善家,被譽為華爾街最成功投資...
閱讀原文

拋棄自回歸,連接一致性Diffusion和LLM!UCSD上交新作熱度緊追AF 3

新智元報道編輯:喬楊 好困 【新智元導讀】來自加州大學圣地亞哥分校和上海交通大學的幾位研究者發表了他們關于「一致性大語言模型」的研究成果(Consistency...
閱讀原文

RAG還是微調?萬字長文總結大模型微調技能圖譜

隨著大模型的飛速發展,在短短一年間就有了大幅度的技術迭代更新,從LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸餾技術到模型增量...
閱讀原文

獨家揭秘,加速進化公司的人形機器人,為什么也能夠旋轉起身?

大數據文摘受權轉載自機器人大講堂 4月18日,波士頓動力新一代 Atlas 用以恐怖片的方式站起來的動作引起全網震驚,而僅僅一周后,中國人形機器人公司加速進化...
閱讀原文

ICLR 2024 Oral|用巧妙的「傳送」技巧,讓神經網絡的訓練更加高效

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

微調和量化竟會增加越獄風險!Mistral、Llama等無一幸免

新智元報道編輯:alan 【新智元導讀】大模型的安全漏洞又填一筆!最新研究表明,對任何下游任務進行微調和量化都可能會影響LLM的安全性,即使本身并沒有惡意...
閱讀原文

OpenAI泄密者,投奔馬斯克

白交 衡宇 發自 凹非寺量子位 | 公眾號 QbitAI剛被OpenAI開除的泄密者,光速投奔馬斯克。 當事人Pavel Izmailov(以下簡稱小P),正是Ilya盟友之一,在Ilya領...
閱讀原文

辯證看待“幻覺”問題,蔚來汽車在AI和大模型領域的應用實踐

演講嘉賓|潘鵬舉 編輯|何逸燦 隨著新能源汽車大戰進入“智能化”的下半場,受政策、技術、市場的驅動,車企競相踏入 AI 大模型這片藍海。就在幾天前,蔚來自...
閱讀原文

Meta 聯合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質量數據之謎。

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

全面解析RLHF,PPO,DPO,Flash Attention,增量學習等大模型算法

隨著大模型的飛速發展,在短短一年間就有了大幅度的技術迭代更新,從LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸餾技術到模型增量...
閱讀原文

CVPR 2024 | 擅長處理復雜場景和語言表達,清華&博世提出全新實例分割網絡架構MagNet

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

OpenAI陷巨大算力荒,國內大廠搶先破局!打破單芯片限制,算力效率提升33%

新智元報道編輯:編輯部 【新智元導讀】一切計算皆AI已成為行業共識。大模型參數規模從千億走向萬億,從單一走向MoE,對算力的需求愈加龐大。我們需要理清的...
閱讀原文

這就是OpenAI神秘的Q*?斯坦福:語言模型就是Q函數

機器之心報道 編輯:Panda??還記得去年 11 月底爆出來的 Q* 項目嗎?這是傳說中 OpenAI 正在秘密開展、或將帶來顛覆性變革的 AI 項目。如果你想回憶一下,可...
閱讀原文
1789101118