亞馬遜工程師嚴(yán)選，超 40 篇 LLM 論文匯總

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布 HyperAI超神經(jīng)

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：亞馬遜工程師嚴(yán)選，超 40 篇 LLM 論文匯總
關(guān)鍵字：模型,研究人員,語言,原文,作者
文章來源：HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù)：29470字

內(nèi)容摘要：

作者：Eugene Yan
編輯：李寶珠，三羊
亞馬遜工程師 Eugene Yan 等人建立了一個(gè)語言模型論文閱讀清單，持續(xù)分享前沿論文，目前已經(jīng)匯總了 40 余篇高質(zhì)量論文。2023 年，大語言模型依舊是「話題制造機(jī)」，不管是 OpenAI 的「宮斗劇」，還是各個(gè)大廠的新模型、新產(chǎn)品「神仙打架」，亦或是行業(yè)大模型發(fā)展的風(fēng)生水起，都昭示著大語言模型具備巨大的發(fā)展空間。花香自引蝶，其實(shí)從 ChatGPT 一夜爆紅后，我們便時(shí)常能夠聽到各路大佬下場(chǎng)入局的消息，資金或技術(shù)背景各異的初創(chuàng)公司如雨后春筍般拔地而起。
顯然，這樣的熱鬧場(chǎng)景并不會(huì)在 2024 年輕易冷卻。越來越多的企業(yè)、傳統(tǒng)行業(yè)開始探索如何應(yīng)用大語言模型與自身業(yè)務(wù)相結(jié)合，快速膨脹的市場(chǎng)需求也反向推動(dòng)了相關(guān)領(lǐng)域的研究進(jìn)一步深化、創(chuàng)新，arXiv 等平臺(tái)上的論文更新也愈發(fā)頻繁。
其中，哪些論文值得看？復(fù)雜的論文題目背后講的是哪些知識(shí)點(diǎn)？
為了幫助大家更快檢索高價(jià)值論文，亞馬遜工程師 Eugene Yan 等人建立了一個(gè)語言模型論文閱讀清單，持續(xù)分享前沿論文，目前已經(jīng)匯總了 40 余篇高質(zhì)量論文。
合集鏈接：
https://eugene

原文鏈接：亞馬遜工程師嚴(yán)選，超 40 篇 LLM 論文匯總