標簽:方法

CMU朱俊彥、Adobe新作:512×512圖像推理,A100只用0.11秒

機器之心報道 編輯:陳萍、杜偉可玩性極強!簡筆素描一鍵變身多風格畫作,還能添加額外的描述,這在 CMU、Adobe 聯合推出的一項研究中實現了。 作者之一為 CM...
閱讀原文

如何從頭開始編寫LoRA代碼,這有一份教程

選自 lightning.ai 作者:Sebastian Raschka 機器之心編譯 編輯:陳萍作者表示:在各種有效的 LLM 微調方法中,LoRA 仍然是他的首選。LoRA(Low-Rank Adaptat...
閱讀原文

可控圖像生成最新綜述!北郵開源20頁249篇文獻,包攬Text-to-Image Diffusion領域各種「條件」

新智元報道編輯:LRS 【新智元導讀】利用文本生成圖片(Text-to-Image, T2I)已經滿足不了人們的需要了,近期研究在T2I模型的基礎上引入了更多類型的條件來生...
閱讀原文

COLING24|自適應剪枝讓多模態大模型加速2-3倍,哈工大等推出SmartTrim

機器之心專欄 機器之心編輯部基于 Transformer 結構的視覺語言大模型(VLM)在各種下游的視覺語言任務上取得了巨大成功,但由于其較長的輸入序列和較多的參數...
閱讀原文

如何把大模型壓縮到1bit?論文作者這樣說

自從大模型火爆出圈以后,人們對壓縮大模型的愿望從未消減。這是因為,雖然大模型在很多方面表現出優秀的能力,但高昂的部署代價極大提升了它的使用門檻。這...
閱讀原文

今日arXiv最熱大模型論文:超越LoRA,北京大學提出預訓練模型非梯度優化法

夕小瑤科技說 原創編輯 | 松果 引言:探索大型語言模型中低秩適應的新方法在自然語言處理領域,大語言模型(LLMs)的迅猛發展帶來了前所未有的性能提升。然而...
閱讀原文

7B大模型測試成績超GPT-4!微軟新研究解決工具調用難題

微軟靠“想象力”解決大語言模型調用工具兩大難題!方法已開源。 作者|徐珊 編輯|云鵬 智東西3月10日消息,近日微軟和俄亥俄州立大學的研究人員發布論文,提出...
閱讀原文

一文看盡297篇文獻!中科院領銜發表首篇「基于擴散模型的圖像編輯」綜述

新智元報道編輯:LRS 【新智元導讀】AIGC大模型最火熱的任務之一——基于Diffusion Model的圖像編輯(editing)領域的首篇綜述,長達26頁,涵蓋297篇文獻!本文...
閱讀原文

全面超越ViT,美團、浙大等提出視覺任務統一架構VisionLLAMA

機器之心專欄 機器之心編輯部半年多來,Meta 開源的 LLaMA 架構在 LLM 中經受了考驗并大獲成功(訓練穩定、容易做 scaling)。 沿襲 ViT 的研究思路,我們能...
閱讀原文

ICLR 2024 Spotlight | 大語言模型權重、激活的全方位低bit可微量化,已集成進商用APP

機器之心專欄 作者:邵文琪模型量化是模型壓縮與加速中的一項關鍵技術,其將模型權重與激活值量化至低 bit,以允許模型占用更少的內存開銷并加快推理速度。對...
閱讀原文

中科院等萬字詳解:最前沿圖像擴散模型綜述

黃健成 投稿量子位 | 公眾號 QbitAI針對圖像編輯中的擴散模型,中科院聯合Adobe和蘋果公司的研究人員發布了一篇重磅綜述。 全文長達26頁,共1.5萬余詞,涵蓋2...
閱讀原文

今日arXiv最熱大模型論文:哈工深新研究發現!無需額外資源,SelectIT方法助力大語言模型精準調優

夕小瑤科技說 原創作者 | 松果 引言:指令調優在大型語言模型中的重要性在當今的人工智能領域,大語言模型(LLMs)已經成為了研究的熱點,它們在理解指令和解...
閱讀原文

ICLR 2024 | 為音視頻分離提供新視角,清華大學胡曉林團隊推出RTFS-Net

機器之心專欄 機器之心編輯部視聽語音分離(AVSS)技術旨在通過面部信息從混合信號中分離出目標說話者的聲音。這項技術能夠應用于智能助手、遠程會議和增強現...
閱讀原文

CVPR 2024滿分論文:浙大提出基于可變形三維高斯的高質量單目動態重建新方法

機器之心專欄 機器之心編輯部單目動態場景(Monocular Dynamic Scene)是指使用單眼攝像頭觀察并分析的動態環境,其中場景中的物體可以自由移動。單目動態場...
閱讀原文

清華、哈工大把大模型壓縮到了1bit,把大模型放在手機里跑的愿望就快要實現了!

機器之心專欄 機器之心編輯部近期,清華大學和哈爾濱工業大學聯合發布了一篇論文:把大模型壓縮到 1.0073 個比特時,仍然能使其保持約 83% 的性能!自從大模...
閱讀原文
1101112131421