標(biāo)簽:方法
參數(shù)少80%,效果仍超LoRA!上交大&上海AI Lab推出高效微調(diào)框架FLoRA
Huiser 投稿量子位 | 公眾號(hào) QbitAI為了讓大模型在特定任務(wù)、場(chǎng)景下發(fā)揮更大作用,LoRA這樣能夠平衡性能和算力資源的方法正在受到研究者們的青睞。 然而,以L...
大模型性能摻水嚴(yán)重?北大交出答卷:交互評(píng)估+動(dòng)態(tài)出題,死記硬背也沒(méi)用 | ACL 2024
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】當(dāng)前大語(yǔ)言模型(LLM)的評(píng)估方法受到數(shù)據(jù)污染問(wèn)題的影響,導(dǎo)致評(píng)估結(jié)果被高估,無(wú)法準(zhǔn)確反映模型的真實(shí)能力。北京大學(xué)等...
ACL2024主會(huì):無(wú)需訓(xùn)練的大模型推薦系統(tǒng)!
夕小瑤科技說(shuō) 原創(chuàng)作者 | Axe_越如今,各種推薦系統(tǒng)無(wú)時(shí)無(wú)刻不在包圍著我們的生活,自大模型(Large Language Model, LLM)時(shí)代以來(lái),得益于LLM的高自由度,...
比LERF提速199倍!清華哈佛發(fā)布LangSplat:三維語(yǔ)義高斯?jié)姙R | CVPR 2024 Highlight
新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】本文將為大家介紹CVPR 2024 Highlight的論文LangSplat: 3D Language Gaussian Splatting(三維語(yǔ)義高斯?jié)姙R)。LangSpla...
史上首個(gè)實(shí)時(shí)AI視頻生成技術(shù):DiT通用,速度提升10.6倍
機(jī)器之心報(bào)道 機(jī)器之心編輯部DiT 都能用,生成視頻無(wú)質(zhì)量損失,也不需要訓(xùn)練。實(shí)時(shí) AI 視頻生成來(lái)了! 本周三,新加坡國(guó)立大學(xué)尤洋團(tuán)隊(duì)提出了業(yè)內(nèi)第一種可以...
GPAvatar:僅需單圖,快速且精準(zhǔn)的3D頭像重建及其表情控制
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門創(chuàng)投 作者:楚選耕 頭部虛擬形象的重建對(duì)于虛擬現(xiàn)實(shí)、在線會(huì)議、游戲和電影等行業(yè)的應(yīng)用至關(guān)重要。 該領(lǐng)域的主要目標(biāo)是忠實(shí)地重建頭...
小紅書怎么用大模型?頂會(huì)作者在線等你來(lái)聊
允中 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI大模型正引領(lǐng)新一輪的研究熱潮,業(yè)界和學(xué)術(shù)界都涌現(xiàn)出了眾多的創(chuàng)新成果。 小紅書技術(shù)團(tuán)隊(duì)也在這一浪潮中不斷探索,多...
又一篇AI頂會(huì)!這個(gè)idea“ 殺瘋了 ” ….
很多人總是誤以為,靠著自己的認(rèn)真努力就能把SCI/CCF論文發(fā)出來(lái),可真相是:只知道一味地努力,是一種完完全全錯(cuò)誤的學(xué)生思維,是發(fā)不出論文的。 科研是有“門...
今日arXiv最熱大模型論文:大模型對(duì)齊告別微調(diào),直接編輯表征空間即可解決
夕小瑤科技說(shuō) 原創(chuàng)作者 | Richard人工智能技術(shù)正在飛速發(fā)展,尤其是大語(yǔ)言模型在自然語(yǔ)言處理領(lǐng)域取得了令人矚目的成就。但同時(shí),我們也面臨著如何讓語(yǔ)言模型...
提速199倍!清華&哈佛發(fā)布三維語(yǔ)義高斯?jié)姙RLangSplat|CVPR‘24 Highlight
LangSplat團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI入選CVPR 2024 Highlight的三維語(yǔ)義高斯?jié)姙R最新成果,查詢速度比之前的SOTA方法LERF快了199倍! 清華&哈佛團(tuán)...
OpenAI 是如何估計(jì)與分析模型計(jì)算量的?
直播預(yù)告 | 6月25日10點(diǎn),「智猩猩AI新青年講座」第241講正式開講,伊利諾伊大學(xué)厄巴納-香檳分校在讀博士趙曉明將直播講解《從單目視頻中合成動(dòng)態(tài)新視圖》,...
導(dǎo)師爆料:這篇CVPR最佳學(xué)生論文,從想法到成稿只用一個(gè)月,源自業(yè)余靈感
機(jī)器之心報(bào)道 機(jī)器之心編輯部按部就班 vs. 好奇心驅(qū)動(dòng),哪個(gè)更容易出研究成果?CVPR 2024 的最佳學(xué)生論文,竟然是用一個(gè)月的時(shí)間寫出來(lái)的。 北京時(shí)間 6 月 20...
Nature重磅:大模型的謊言如何“破”?牛津團(tuán)隊(duì)提出新方法,無(wú)需人工監(jiān)督或特定領(lǐng)域知識(shí)
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條 世界衛(wèi)生組織(WHO)的人工智能健康資源助手 SARAH 列出了舊金山本不存在的診所的虛假名稱和地址。 Meta公司“短命”的科學(xué)聊天...
小紅書這場(chǎng)大模型論文分享會(huì),集齊了四大國(guó)際頂會(huì)的作者
大模型正引領(lǐng)新一輪的研究熱潮,業(yè)界和學(xué)術(shù)界都涌現(xiàn)出了眾多的創(chuàng)新成果。 小紅書技術(shù)團(tuán)隊(duì)也在這一浪潮中不斷探索,多篇論文研究成果在 ICLR、ACL、CVPR、AAAI...
1塊3090就能訓(xùn)7B大模型,山東大學(xué)低帶寬低顯存訓(xùn)練法,解決顯卡限購(gòu)卡脖子
夕小瑤科技說(shuō) 原創(chuàng)作者 | 謝年年 大模型的全參數(shù)微調(diào)對(duì)資源要求非常高,當(dāng)前業(yè)界更傾向于采用LoRA,Parallel Adapter等參數(shù)高效微調(diào)(PEFT)方法,通過(guò)添加只...