標(biāo)簽：概率

AI訓(xùn)AI慘遭投毒9次大崩潰，牛津劍橋等驚天發(fā)現(xiàn)登Nature封面！

新智元報(bào)道編輯：編輯部【新智元導(dǎo)讀】9次迭代后，模型開始出現(xiàn)詭異亂碼，直接原地崩潰！就在今天，牛津、劍橋等機(jī)構(gòu)的一篇論文登上了Nature封面，稱合成數(shù)...

1年前 (2024)

Llama 3.1上線就被攻破：大罵小扎，危險(xiǎn)配方張口就來！指令遵循能力強(qiáng)了更容易越獄

夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI最強(qiáng)大模型Llama 3.1，上線就被攻破了。對(duì)著自己的老板扎克伯格破口大罵，甚至知道如何繞過屏蔽詞。設(shè)計(jì)危險(xiǎn)病毒、...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

一位物理學(xué)家的概率觀

來源：賽先生、《概率論沉思錄》作者：廖海仁導(dǎo)讀：他是圣路易斯華盛頓大學(xué)和斯坦福大學(xué)教授，他的博士論文導(dǎo)師是著名物理學(xué)家、1963 年諾貝爾物理學(xué)獎(jiǎng)得主...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

生成式模型不只會(huì)「模仿」！哈佛、UCSB等最新成果：性能可超越訓(xùn)練集專家水平

新智元報(bào)道編輯：LRS 【新智元導(dǎo)讀】生成式模型原本被設(shè)計(jì)來模仿人類的各種復(fù)雜行為，但人們普遍認(rèn)為它們最多只能達(dá)到與其訓(xùn)練數(shù)據(jù)中的專家相當(dāng)?shù)乃健２贿^...

閱讀原文

AIGC動(dòng)態(tài)

1年前 (2024)

零成本突破多模態(tài)大模型瓶頸！多所美國頂尖高校華人團(tuán)隊(duì)，聯(lián)合推出自增強(qiáng)技術(shù)CSR

新智元報(bào)道編輯：LRST 【新智元導(dǎo)讀】現(xiàn)有多模態(tài)大模型在對(duì)齊不同模態(tài)時(shí)面臨幻覺和細(xì)粒度感知不足等問題，傳統(tǒng)偏好學(xué)習(xí)方法依賴可能不適配的外源數(shù)據(jù)，存在成...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

To Believe or Not to Believe？DeepMind新研究一眼看穿LLM幻覺

新智元報(bào)道編輯：庸庸喬楊【新智元導(dǎo)讀】DeepMind發(fā)表了一篇名為「To Believe or Not to Believe Your LLM」的新論文，探討了LLM的不確定性量化問題，通過...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

長文 | 大模型偏好對(duì)齊全家桶 – RL側(cè)

今天給大家?guī)硪黄猂einforcement Learning from Human Feedback的全家桶，來自知乎@何枝（已授權(quán)）。隨著 Llama3 的開源，人們對(duì) Alignment 的重視程度又上...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

今日arXiv最熱NLP大模型論文：清華大學(xué)提出IFT對(duì)齊算法，打破SFT與RLHF局限性

夕小瑤科技說原創(chuàng)作者 | 謝年年監(jiān)督微調(diào)（Supervised Fine-Tuning, SFT）和基于人類反饋的強(qiáng)化學(xué)習(xí)（Reinforcement Learning from Human Feedback, RLHF）...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

陳丹琦團(tuán)隊(duì)新作：微調(diào)8B模型超越Claude3 Opus，背后是RLHF新平替

克雷西發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI比斯坦福DPO（直接偏好優(yōu)化）更簡單的RLHF平替來了，來自陳丹琦團(tuán)隊(duì)。該方式在多項(xiàng)測(cè)試中性能都遠(yuǎn)超DPO，還能讓8B...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

熱帖：大語言模型自薦能夠替代的20種人類工作！快來看你是否需要轉(zhuǎn)行！

夕小瑤科技說原創(chuàng)作者 | 付奶茶最近推特上有一個(gè)例子引起了廣泛的討論，事情的起因是這樣的：網(wǎng)友讓 GPT-4o 預(yù)測(cè)一下自己未來將會(huì)替代人類哪些工作？這聽起...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

以ACL 2024為例，從投稿到接收：頂會(huì)投稿后全流程揭秘

夕小瑤科技說分享作者 | Erutan Lai來源 | 知乎想必很多同學(xué)都會(huì)感到好奇，論文投稿之后會(huì)經(jīng)歷什么？寫這篇文章，就我所知的，簡單科普一下。畢竟沒當(dāng)過大C...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

AI足球教練上崗利物浦，射門機(jī)會(huì)提高13%！來自DeepMind，網(wǎng)友：這不公平

夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAIAI足球教練登上Nature子刊，谷歌DeepMind與利物浦隊(duì)合作三年打造：如同AlphaGo顛覆圍棋一樣，改變了球隊(duì)制定戰(zhàn)術(shù)的...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

ICLR 2024 | 無需訓(xùn)練，F(xiàn)ast-DetectGPT讓文本檢測(cè)速度提升340倍

機(jī)器之心專欄機(jī)器之心編輯部Fast-DetectGPT同時(shí)做到了高準(zhǔn)確率、高速度、低成本、通用，掃清了實(shí)際應(yīng)用的障礙！大語言模型如 ChatGPT 和 GPT-4 在各個(gè)領(lǐng)域?qū)?..

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

長文綜述：大腦中的熵、能、對(duì)稱性和動(dòng)力學(xué)｜新春特輯

導(dǎo)語我們的大腦在一定程度上是貝葉斯推理系統(tǒng)，生成內(nèi)部模型對(duì)外部世界作出預(yù)測(cè)，然后將預(yù)測(cè)與感官輸入不斷地進(jìn)行對(duì)比，形成預(yù)測(cè)誤差并更新內(nèi)部模型。2022年...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

根據(jù)模型輸出反轉(zhuǎn)LLM輸入提示，讓惡意攻擊無處可藏

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投作者：seven_ 近一段時(shí)間以來，工業(yè)界和學(xué)術(shù)界都對(duì)大型語言模型（LLM）的內(nèi)部運(yùn)行機(jī)理進(jìn)行了深入的研究和探索。這種基礎(chǔ)理論研...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

123