NeurIPS 2023精選回顧：大模型最火，清華ToT思維樹上榜

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：NeurIPS 2023精選回顧：大模型最火，清華ToT思維樹上榜
關鍵字：模型,論文,語言,能力,題目
文章來源：新智元
內容字數：7913字

內容摘要：

新智元報道編輯：Mindy
【新智元導讀】美國著名科技播客Latent Space對于剛剛過去的NeurIPS 2023上的精彩論文進行了一個全面的總結，回顧了多篇優秀論文，雖然沒有獲獎，但同樣值得學界關注。近日，作為美國前十的科技博客，Latent Space對于剛剛過去的NeurIPS 2023大會進行了精選回顧總結。
在NeurIPS會議總共接受的3586篇論文之中，除去6篇獲獎論文，其他論文也同樣優秀和具有潛力，甚至有可能預示著下一個AI領域的新突破。
那就讓我們來一起看看吧！
論文題目：QLoRA: Efficient Finetuning of Quantized LLMs論文地址：https://openreview.net/pdf?id=OUIFPHEgJU
這篇論文提出了QLoRA，這是LoRA的一種更省內存但速度較慢的版本，它使用了幾種優化技巧來節省內存。
總體而言，QLoRA使得在對大型語言模型進行微調時可以使用更少的GPU內存。
他們訓練了一個新模型，Guanaco，僅在單個GPU上進行了為期24小時的微調，并在Vicuna基準測試中表現優于先前的模型。
與此

原文鏈接：NeurIPS 2023精選回顧：大模型最火，清華ToT思維樹上榜