
AIGC動態歡迎閱讀
原標題:NeurIPS 2023精選回顧:大模型最火,清華ToT思維樹上榜
關鍵字:模型,論文,語言,能力,題目
文章來源:新智元
內容字數:7913字
內容摘要:
新智元報道編輯:Mindy
【新智元導讀】美國著名科技播客Latent Space對于剛剛過去的NeurIPS 2023上的精彩論文進行了一個全面的總結,回顧了多篇優秀論文,雖然沒有獲獎,但同樣值得學界關注。近日,作為美國前十的科技博客,Latent Space對于剛剛過去的NeurIPS 2023大會進行了精選回顧總結。
在NeurIPS會議總共接受的3586篇論文之中,除去6篇獲獎論文,其他論文也同樣優秀和具有潛力,甚至有可能預示著下一個AI領域的新突破。
那就讓我們來一起看看吧!
論文題目:QLoRA: Efficient Finetuning of Quantized LLMs論文地址:https://openreview.net/pdf?id=OUIFPHEgJU
這篇論文提出了QLoRA,這是LoRA的一種更省內存但速度較慢的版本,它使用了幾種優化技巧來節省內存。
總體而言,QLoRA使得在對大型語言模型進行微調時可以使用更少的GPU內存。
他們訓練了一個新模型,Guanaco,僅在單個GPU上進行了為期24小時的微調,并在Vicuna基準測試中表現優于先前的模型。
與此
原文鏈接:NeurIPS 2023精選回顧:大模型最火,清華ToT思維樹上榜
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號