標(biāo)簽:概率

AI訓(xùn)AI慘遭投毒9次大崩潰,牛津劍橋等驚天發(fā)現(xiàn)登Nature封面!

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】9次迭代后,模型開始出現(xiàn)詭異亂碼,直接原地崩潰!就在今天,牛津、劍橋等機(jī)構(gòu)的一篇論文登上了Nature封面,稱合成數(shù)...
閱讀原文

Llama 3.1上線就被攻破:大罵小扎,危險(xiǎn)配方張口就來!指令遵循能力強(qiáng)了更容易越獄

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI最強(qiáng)大模型Llama 3.1,上線就被攻破了。 對(duì)著自己的老板扎克伯格破口大罵,甚至知道如何繞過屏蔽詞。 設(shè)計(jì)危險(xiǎn)病毒、...
閱讀原文

一位物理學(xué)家的概率觀

來源:賽先生、《概率論沉思錄》 作者:廖海仁 導(dǎo)讀:他是圣路易斯華盛頓大學(xué)和斯坦福大學(xué)教授,他的博士論文導(dǎo)師是著名物理學(xué)家、1963 年諾貝爾物理學(xué)獎(jiǎng)得主...
閱讀原文

生成式模型不只會(huì)「模仿」!哈佛、UCSB等最新成果:性能可超越訓(xùn)練集專家水平

新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】生成式模型原本被設(shè)計(jì)來模仿人類的各種復(fù)雜行為,但人們普遍認(rèn)為它們最多只能達(dá)到與其訓(xùn)練數(shù)據(jù)中的專家相當(dāng)?shù)乃健2贿^...
閱讀原文

零成本突破多模態(tài)大模型瓶頸!多所美國頂尖高校華人團(tuán)隊(duì),聯(lián)合推出自增強(qiáng)技術(shù)CSR

新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】現(xiàn)有多模態(tài)大模型在對(duì)齊不同模態(tài)時(shí)面臨幻覺和細(xì)粒度感知不足等問題,傳統(tǒng)偏好學(xué)習(xí)方法依賴可能不適配的外源數(shù)據(jù),存在成...
閱讀原文

To Believe or Not to Believe?DeepMind新研究一眼看穿LLM幻覺

新智元報(bào)道編輯:庸庸 喬楊 【新智元導(dǎo)讀】DeepMind發(fā)表了一篇名為「To Believe or Not to Believe Your LLM」的新論文,探討了LLM的不確定性量化問題,通過...
閱讀原文

長文 | 大模型偏好對(duì)齊全家桶 – RL側(cè)

今天給大家?guī)硪黄猂einforcement Learning from Human Feedback的全家桶,來自知乎@何枝(已授權(quán))。 隨著 Llama3 的開源,人們對(duì) Alignment 的重視程度又上...
閱讀原文

今日arXiv最熱NLP大模型論文:清華大學(xué)提出IFT對(duì)齊算法,打破SFT與RLHF局限性

夕小瑤科技說 原創(chuàng)作者 | 謝年年 監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)和基于人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback, RLHF)...
閱讀原文

陳丹琦團(tuán)隊(duì)新作:微調(diào)8B模型超越Claude3 Opus,背后是RLHF新平替

克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI比斯坦福DPO(直接偏好優(yōu)化)更簡單的RLHF平替來了,來自陳丹琦團(tuán)隊(duì)。 該方式在多項(xiàng)測(cè)試中性能都遠(yuǎn)超DPO,還能讓8B...
閱讀原文

熱帖:大語言模型自薦能夠替代的20種人類工作!快來看你是否需要轉(zhuǎn)行!

夕小瑤科技說 原創(chuàng)作者 | 付奶茶最近推特上有一個(gè)例子引起了廣泛的討論,事情的起因是這樣的:網(wǎng)友讓 GPT-4o 預(yù)測(cè)一下自己未來將會(huì)替代人類哪些工作? 這聽起...
閱讀原文

以ACL 2024為例,從投稿到接收:頂會(huì)投稿后全流程揭秘

夕小瑤科技說 分享作者 | Erutan Lai來源 | 知乎想必很多同學(xué)都會(huì)感到好奇,論文投稿之后會(huì)經(jīng)歷什么? 寫這篇文章,就我所知的,簡單科普一下。畢竟沒當(dāng)過大C...
閱讀原文

AI足球教練上崗利物浦,射門機(jī)會(huì)提高13%!來自DeepMind,網(wǎng)友:這不公平

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIAI足球教練登上Nature子刊,谷歌DeepMind與利物浦隊(duì)合作三年打造: 如同AlphaGo顛覆圍棋一樣,改變了球隊(duì)制定戰(zhàn)術(shù)的...
閱讀原文

ICLR 2024 | 無需訓(xùn)練,F(xiàn)ast-DetectGPT讓文本檢測(cè)速度提升340倍

機(jī)器之心專欄 機(jī)器之心編輯部Fast-DetectGPT同時(shí)做到了高準(zhǔn)確率、高速度、低成本、通用,掃清了實(shí)際應(yīng)用的障礙!大語言模型如 ChatGPT 和 GPT-4 在各個(gè)領(lǐng)域?qū)?..
閱讀原文

長文綜述:大腦中的熵、能、對(duì)稱性和動(dòng)力學(xué)|新春特輯

導(dǎo)語我們的大腦在一定程度上是貝葉斯推理系統(tǒng),生成內(nèi)部模型對(duì)外部世界作出預(yù)測(cè),然后將預(yù)測(cè)與感官輸入不斷地進(jìn)行對(duì)比,形成預(yù)測(cè)誤差并更新內(nèi)部模型。2022年...
閱讀原文

根據(jù)模型輸出反轉(zhuǎn)LLM輸入提示,讓惡意攻擊無處可藏

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:seven_ 近一段時(shí)間以來,工業(yè)界和學(xué)術(shù)界都對(duì)大型語言模型(LLM)的內(nèi)部運(yùn)行機(jī)理進(jìn)行了深入的研究和探索。這種基礎(chǔ)理論研...
閱讀原文
123