標(biāo)簽:概率
AI訓(xùn)AI慘遭投毒9次大崩潰,牛津劍橋等驚天發(fā)現(xiàn)登Nature封面!
新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】9次迭代后,模型開始出現(xiàn)詭異亂碼,直接原地崩潰!就在今天,牛津、劍橋等機(jī)構(gòu)的一篇論文登上了Nature封面,稱合成數(shù)...
Llama 3.1上線就被攻破:大罵小扎,危險(xiǎn)配方張口就來!指令遵循能力強(qiáng)了更容易越獄
夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI最強(qiáng)大模型Llama 3.1,上線就被攻破了。 對(duì)著自己的老板扎克伯格破口大罵,甚至知道如何繞過屏蔽詞。 設(shè)計(jì)危險(xiǎn)病毒、...
一位物理學(xué)家的概率觀
來源:賽先生、《概率論沉思錄》 作者:廖海仁 導(dǎo)讀:他是圣路易斯華盛頓大學(xué)和斯坦福大學(xué)教授,他的博士論文導(dǎo)師是著名物理學(xué)家、1963 年諾貝爾物理學(xué)獎(jiǎng)得主...
生成式模型不只會(huì)「模仿」!哈佛、UCSB等最新成果:性能可超越訓(xùn)練集專家水平
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】生成式模型原本被設(shè)計(jì)來模仿人類的各種復(fù)雜行為,但人們普遍認(rèn)為它們最多只能達(dá)到與其訓(xùn)練數(shù)據(jù)中的專家相當(dāng)?shù)乃健2贿^...
零成本突破多模態(tài)大模型瓶頸!多所美國頂尖高校華人團(tuán)隊(duì),聯(lián)合推出自增強(qiáng)技術(shù)CSR
新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】現(xiàn)有多模態(tài)大模型在對(duì)齊不同模態(tài)時(shí)面臨幻覺和細(xì)粒度感知不足等問題,傳統(tǒng)偏好學(xué)習(xí)方法依賴可能不適配的外源數(shù)據(jù),存在成...
To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻覺
新智元報(bào)道編輯:庸庸 喬楊 【新智元導(dǎo)讀】DeepMind發(fā)表了一篇名為「To Believe or Not to Believe Your LLM」的新論文,探討了LLM的不確定性量化問題,通過...
長文 | 大模型偏好對(duì)齊全家桶 – RL側(cè)
今天給大家?guī)硪黄猂einforcement Learning from Human Feedback的全家桶,來自知乎@何枝(已授權(quán))。 隨著 Llama3 的開源,人們對(duì) Alignment 的重視程度又上...
今日arXiv最熱NLP大模型論文:清華大學(xué)提出IFT對(duì)齊算法,打破SFT與RLHF局限性
夕小瑤科技說 原創(chuàng)作者 | 謝年年 監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)和基于人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback, RLHF)...
陳丹琦團(tuán)隊(duì)新作:微調(diào)8B模型超越Claude3 Opus,背后是RLHF新平替
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI比斯坦福DPO(直接偏好優(yōu)化)更簡單的RLHF平替來了,來自陳丹琦團(tuán)隊(duì)。 該方式在多項(xiàng)測(cè)試中性能都遠(yuǎn)超DPO,還能讓8B...
熱帖:大語言模型自薦能夠替代的20種人類工作!快來看你是否需要轉(zhuǎn)行!
夕小瑤科技說 原創(chuàng)作者 | 付奶茶最近推特上有一個(gè)例子引起了廣泛的討論,事情的起因是這樣的:網(wǎng)友讓 GPT-4o 預(yù)測(cè)一下自己未來將會(huì)替代人類哪些工作? 這聽起...
以ACL 2024為例,從投稿到接收:頂會(huì)投稿后全流程揭秘
夕小瑤科技說 分享作者 | Erutan Lai來源 | 知乎想必很多同學(xué)都會(huì)感到好奇,論文投稿之后會(huì)經(jīng)歷什么? 寫這篇文章,就我所知的,簡單科普一下。畢竟沒當(dāng)過大C...
AI足球教練上崗利物浦,射門機(jī)會(huì)提高13%!來自DeepMind,網(wǎng)友:這不公平
夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIAI足球教練登上Nature子刊,谷歌DeepMind與利物浦隊(duì)合作三年打造: 如同AlphaGo顛覆圍棋一樣,改變了球隊(duì)制定戰(zhàn)術(shù)的...
ICLR 2024 | 無需訓(xùn)練,F(xiàn)ast-DetectGPT讓文本檢測(cè)速度提升340倍
機(jī)器之心專欄 機(jī)器之心編輯部Fast-DetectGPT同時(shí)做到了高準(zhǔn)確率、高速度、低成本、通用,掃清了實(shí)際應(yīng)用的障礙!大語言模型如 ChatGPT 和 GPT-4 在各個(gè)領(lǐng)域?qū)?..
長文綜述:大腦中的熵、能、對(duì)稱性和動(dòng)力學(xué)|新春特輯
導(dǎo)語我們的大腦在一定程度上是貝葉斯推理系統(tǒng),生成內(nèi)部模型對(duì)外部世界作出預(yù)測(cè),然后將預(yù)測(cè)與感官輸入不斷地進(jìn)行對(duì)比,形成預(yù)測(cè)誤差并更新內(nèi)部模型。2022年...
根據(jù)模型輸出反轉(zhuǎn)LLM輸入提示,讓惡意攻擊無處可藏
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:seven_ 近一段時(shí)間以來,工業(yè)界和學(xué)術(shù)界都對(duì)大型語言模型(LLM)的內(nèi)部運(yùn)行機(jī)理進(jìn)行了深入的研究和探索。這種基礎(chǔ)理論研...
粵公網(wǎng)安備 44011502001135號(hào)