亚洲综合国产欧洲丝袜,亚洲国产91精品无码专区,91在线精品亚洲一区二区

Guanaco原駝官網

Guanaco原駝，微調LLaMA模型框架，效果直逼GPT-4
網站服務：Guanaco，原駝。

Guanaco原駝官網，微調LLaMA模型框架，效果直逼GPT-4

什么是Guanaco原駝?

華盛頓大學的NLP小組提出了一種名為QLoRA的方法，可以在擁有48GB顯存的顯卡上微調擁有650億參數的LLaMA模型，而且據稱性能幾乎沒有損失。QLoRA是一種新的方法，可以在單個GPU上微調大型語言模型。最近，華盛頓大學的研究人員使用QLoRA方法開發了Guanaco，這是一個基于Meta的LLaMA模型的機器人系列。其中最大的Guanaco變體擁有650億個參數，并在與GPT-4進行基準測試時實現了超過99%與ChatGPT（GPT-3.5-turbo）相近的性能。Guanaco參考網址:? https://github.com/artidoro/qlora

Guanaco技術細節

QLoRA方法是在LLaMA模型的框架下提出的，它包含了以下核心技術原理和與其他方法的區別：

4位NormalFloat：這種理論上最優的量化數據類型用于處理正態分布的數據，優于4位整數和4位浮點數。
Double Quantization：通過對量化常數進行量化，可以減少平均內存占用，每個參數平均可以節省約0.37個bits（對于650億參數的模型來說，大約節省3GB）。
Paged Optimizers：使用NVIDIA統一內存來避免處理小批量長序列時的梯度檢查點內存峰值。

通過QLoRA方法，研究人員在測試中微調了數千個模型，結果顯示基于QLoRA方法微調的Guanaco模型在性能上超越了目前所有的開源模型，甚至比ChatGPT更強大，并接近GPT-4。Guanaco模型包括四個版本，從70億參數到650億參數，所有版本都將開源。這項研究還包含了大量與大模型相關的數據和結論，建議閱讀原始論文以獲取更詳細的信息。論文涵蓋了不同模型的顯存占用、當前大模型評測基準的偏差等內容。QLoRA方法的提出是為了解決如何有效微調大型語言模型以優化其性能的問題。盡管大型模型具有強大的能力，但對于特定領域的數據集來說，微調仍然是必要的，因為企業和個人可能具有特定領域的專有數據和知識，而通用模型的零-shot能力難以擴展到這些特定領域中。QLoRA方法為在48GB顯存的顯卡上微調大模型提供了解決方案，通過量化和其他優化方法，它降低了顯存要求并保持了原始模型的性能。總之，QLoRA方法在大模型微調中具有潛力，可以提供更高效的顯存使用和優越的性能，進一步推動語言模型領域的研究和應用。QLoRA是一種新的方法，可以在單個GPU上微調大型語言模型。最近，華盛頓大學的研究人員使用QLoRA方法開發了Guanaco，這是一個基于Meta的LLaMA模型的機器人系列。其中最大的Guanaco變體擁有650億個參數，并在與GPT-4進行基準測試時實現了超過99%與ChatGPT（GPT-3.5-turbo）相近的性能。微調大型語言模型是提高性能和訓練效果的關鍵技術之一。然而，這個過程對于大型模型來說計算量非常龐大，例如LLaMA65B模型可能需要超過780GB的GPU顯存。盡管開源社區已經使用各種量化方法將16位模型壓縮為4位模型，從而大大減少了推理過程所需的內存，但在微調過程中尚未采用類似的方法。QLoRA方法填補了這一空白，使得在單個GPU上微調大型語言模型成為可能。它通過使用新的量化方法和內存優化技術，有效地降低了顯存需求，并保持了原始模型的性能。Guanaco機器人的發布進一步證明了QLoRA方法的可行性和實用性。Guanaco系列模型在性能上幾乎與ChatGPT相當，而顯存占用明顯較低。這意味著開發人員和研究人員可以在相對較小的計算資源下訓練和微調性能強大的大型語言模型，從而加速自然語言處理和人工智能領域的創新。需要注意的是，盡管QLoRA方法和Guanaco模型在研究和學術領域取得了顯著進展，但目前還不允許商業用途。然而，這一領域的不斷發展和優化為未來的商業應用打下了堅實的基礎。QLoRA方法的提出為微調大型語言模型帶來了新的可能性，尤其是在資源受限的環境中。它為研究人員和開發者提供了更靈活、高效的工具，以加速自然語言處理和人工智能技術的發展，為未來的創新鋪平了道路。研究人員通過QLoRA方法展示了一種將LLaMA等模型量化為4位并進行微調的方法，并引入了Guanaco模型作為示例。通過這種方法，他們成功地將650億參數模型的內存需求從超過780GB降低到不到48GB的GPU內存，并獲得了與微調16位模型相當的結果。QLoRA方法的出現標志著大型語言模型微調的可訪問性取得了重大突破，成為迄今為止在單個GPU上微調的最大公開可用模型。該研究團隊進行了多次實驗，訓練了超過1000個模型，用于測試QLoRA和不同微調數據集的影響。他們的研究發現，數據的質量比任務的數量更為重要。在訓練機器人時，使用OpenAssistant數據集上的人類樣本訓練的模型比使用FLANv2數據集上的大量樣本訓練的模型表現更好。因此，Guanaco模型主要依賴于OpenAssistant數據集。通過QLoRA方法訓練的Guanaco模型系列表現出色，其中第二好的模型以330億個參數在基準測試中實現了97.8%的ChatGPT性能，并且僅用不到12小時的時間在單個普通GPU上完成訓練。在專業級GPU上，具有650億個參數的最大模型僅用24小時就達到了99.3%的ChatGPT性能。最小的Guanaco模型只有70億個參數，僅需要5GB的GPU內存，在Vicuna基準測試中表現出超過26GB羊駝模型20個百分點以上的性能。除了QLoRA和Guanaco模型，該研究團隊還發布了OpenAssistant基準測試，供模型之間相互競爭，并由人類或GPT-4對結果進行評分。然而，該研究團隊指出，數學能力和4位推理速度仍存在問題，他們希望能提高推理速度，預計速度將提高8至16倍。微調是將大型語言模型轉變為像ChatGPT這樣的機器人的重要工具，研究人員相信QLoRA方法將使微調更加易于實現，特別是對于資源有限的研究人員而言。他們認為，這對于自然語言處理領域尖端技術的可訪問性是一個巨大的勝利。除了微調當今最大的語言模型，研究人員還展望了在移動硬件上應用私有模型的可能性。他們表示，QLoRA還將在手機上實現隱私保護微調，預計每晚使用iPhone 12 Plus可微調300萬個單詞。這意味著，將來我們將能夠在手機上運行針對每個應用程序的特定大型語言模型。更多關于Guanaco-33B的信息和代碼可以在GitHub上查看。

Guanaco原駝網址入口

https://github.com/artidoro/qlora

Guanaco原駝

OpenI小編發現Guanaco原駝網站非常受用戶歡迎，請訪問Guanaco原駝網址入口試用。

數據統計

數據評估

Guanaco原駝瀏覽人數已經達到705，如你需要查詢該站的相關權重信息，可以點擊"5118數據""愛站數據""Chinaz數據"進入；以目前的網站數據參考，建議大家請以愛站數據為準，更多網站價值評估因素如：Guanaco原駝的訪問速度、搜索引擎收錄以及索引量、用戶體驗等；當然要評估一個站的價值，最主要還是需要根據您自身的需求以及需要，一些確切的數據則需要找Guanaco原駝的站長進行洽談提供。如該站的IP、PV、跳出率等！

特別聲明

本站OpenI提供的Guanaco原駝都來源于網絡，不保證外部鏈接的準確性和完整性，同時，對于該外部鏈接的指向，不由OpenI實際控制，在2023年 9月 7日下午3:08收錄時，該網頁上的內容，都屬于合規合法，后期網頁的內容如出現違規，可以直接聯系網站管理員進行刪除，OpenI不承擔任何責任。

OpenI致力于優質、實用的網絡站點資源收集與分享！本文地址http://www.futurefh.com/sites/98393.html轉載請注明