標(biāo)簽:任務(wù)

愛丁堡大學(xué)出新招,大小語(yǔ)言模型配合節(jié)約成本!

夕小瑤科技說(shuō) 原創(chuàng)作者 | 墨墨在大語(yǔ)言模型的應(yīng)用中,往往面臨著成本和性能權(quán)衡的問題。 一方面,大型LLM的參數(shù)量極大(如70B),每次調(diào)用都可能帶來(lái)更多的成...
閱讀原文

GPT-4理解武林外傳中的含蓄表述,達(dá)人類水平

? ? 大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自夕小瑤科技說(shuō)作者 | 謝年年 在人際交談中,特別是在使用中文這樣博大精深的語(yǔ)言時(shí),人們往往不會(huì)直接回答問題,而是采用含蓄、隱晦...
閱讀原文

今日arXiv最熱NLP大模型論文:GPT-4理解武林外傳中的含蓄表述,達(dá)人類水平

夕小瑤科技說(shuō) 原創(chuàng)作者 | 謝年年在人際交談中,特別是在使用中文這樣博大精深的語(yǔ)言時(shí),人們往往不會(huì)直接回答問題,而是采用含蓄、隱晦或間接的表達(dá)方式。 人...
閱讀原文

「代理人戰(zhàn)爭(zhēng)」!微軟、OpenAI 、谷歌、Meta用AI Agent瘋錢

新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】為了搞錢,微軟、OpenAI 、谷歌和Meta紛紛瞄準(zhǔn)Agent這片藍(lán)海,各頂尖高校也緊隨其后。Agent才是商業(yè)學(xué)術(shù)兩開花的未來(lái)!...
閱讀原文

告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來(lái)了

機(jī)器之心報(bào)道 編輯:佳琦模型、專家智能體和數(shù)據(jù)集都已開源。隨著 Llama 3 發(fā)布,未來(lái)大模型的參數(shù)量已飆升至驚人的 4000 億。盡管每周幾乎都有一個(gè)聲稱性能...
閱讀原文

AI學(xué)會(huì)隱藏思維暗中推理!不依賴人類經(jīng)驗(yàn)解決復(fù)雜任務(wù),更黑箱了

夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIAI做數(shù)學(xué)題,真正的思考居然是暗中“心算”的? 紐約大學(xué)團(tuán)隊(duì)新研究發(fā)現(xiàn),即使不讓AI寫步驟,全用無(wú)意義的“……”代替,在...
閱讀原文

CVPR‘24:與任務(wù)無(wú)關(guān)的多模態(tài)數(shù)據(jù)也能提升Transformer性能|港中文&騰訊

Yiyuan 投稿量子位 | 公眾號(hào) QbitAI萬(wàn)萬(wàn)沒想到,與任務(wù)無(wú)直接關(guān)聯(lián)的多模態(tài)數(shù)據(jù)也能提升Transformer模型性能。 比如訓(xùn)練一個(gè)圖像分類模型,除了標(biāo)注好類別的圖...
閱讀原文

一次預(yù)測(cè)多個(gè)token,Meta新模型推理加速3倍,編程任務(wù)提高17%

夢(mèng)晨 西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“預(yù)測(cè)下一個(gè)token”被認(rèn)為是大模型的基本范式,一次預(yù)測(cè)多個(gè)tokens又會(huì)怎樣? Meta AI法國(guó)團(tuán)隊(duì)推出“基于多token...
閱讀原文

大語(yǔ)言模型自進(jìn)化技術(shù)綜述:概念框架,進(jìn)化方向,經(jīng)驗(yàn)獲取,經(jīng)驗(yàn)更新,評(píng)估方法,開放問題

我們翻譯整理最新論文:大語(yǔ)言模型自我進(jìn)化技術(shù)綜述,文末有論文連接。 大型語(yǔ)言模型(LLMs)在各個(gè)領(lǐng)域和智能體應(yīng)用中取得了顯著進(jìn)展。然而,當(dāng)前從人類或外...
閱讀原文

神秘模型"gpt2-chatbot"現(xiàn)身,引發(fā)GPT-4.5/GPT-5瘋狂猜想

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自頭部科技 文丨Congerry OpenAI放出了一個(gè)迷霧彈。 當(dāng)Google、Meta、Anthropic等公司都在猛推大模型的時(shí)候,OpenAI除了對(duì)GPT-4修修補(bǔ)補(bǔ),...
閱讀原文

神秘GPT模型引爆社區(qū),GPT-4.5、GPT-5謠言滿天飛,奧特曼在線圍觀

機(jī)器之心報(bào)道 編輯:杜偉、陳萍這場(chǎng)等待「GPT-5」的游戲啥時(shí)候才能結(jié)束?GPT-5 啥時(shí)候來(lái)?估計(jì)是 AI 領(lǐng)域最關(guān)心的問題之一了。是像 Sora 一樣毫無(wú)預(yù)兆的發(fā)布...
閱讀原文

智子引擎發(fā)布多模態(tài)大模型 Awaker:MOE、自主更新、寫真視頻效果優(yōu)于 Sora

在 4 月 27 日召開的中關(guān)村論壇通用人工智能平行論壇上,人大系初創(chuàng)公司智子引擎隆重發(fā)布全新的多模態(tài)大模型 Awaker 1.0。 相對(duì)于智子引擎前代的 ChatImg 序...
閱讀原文

MIT研究登頂會(huì)ICLR 2024:讓機(jī)器人掌握"常識(shí)",自主完成復(fù)雜家務(wù)

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自機(jī)器人大講堂 在人工智能飛速發(fā)展的今天,家用服務(wù)機(jī)器人正日益走進(jìn)尋常百姓家。然而,要讓機(jī)器人像人一樣靈活應(yīng)對(duì)家庭環(huán)境的復(fù)雜多變,...
閱讀原文

全球首個(gè)自主進(jìn)化多模態(tài)MoE震撼登場(chǎng)!寫真視頻擊敗Sora,人大系團(tuán)隊(duì)自研底座VDT

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】人大系初創(chuàng)公司智子引擎發(fā)布的全新多模態(tài)大模型Awaker 1.0,直接邁向了AGI!它是業(yè)界首個(gè)真正實(shí)現(xiàn)自主更新的大模型,...
閱讀原文

今日arXiv最熱NLP大模型論文:超越GPT-4,清華發(fā)布網(wǎng)頁(yè)導(dǎo)航智能體AutoWebGLM

夕小瑤科技說(shuō) 原創(chuàng)作者 | Tscom隨著大語(yǔ)言模型(LLMs)的發(fā)展,Agent在網(wǎng)絡(luò)導(dǎo)航等任務(wù)中展現(xiàn)出了前所未有的能力。想象一下,一個(gè)基于LLM的Agent能夠在你享用...
閱讀原文
1202122232448