標簽：指令

OpenAI把GPT-4原始版給了他們：研究不微調只靠提示詞能走多遠

夢晨發自凹非寺量子位 | 公眾號 QbitAI除了OpenAI自己，居然還有別人能用上GPT-4-Base版？？也就是未經微調的預訓練版，還不會對話聊天，只會補全句子的模...

閱讀原文

AIGC動態

1年前 (2024)

用GPT-3.5生成數據集！北大天工等團隊圖像編輯新SOTA，可精準模擬物理世界場景

楊靈投稿量子位 | 公眾號 QbitAI高質量圖像編輯的方法有很多，但都很難準確表達出真實的物理世界。那么，Edit the World試試。來自北京大學、Tiamat AI、...

閱讀原文

AIGC動態

1年前 (2024)

無需OpenAI數據，躋身代碼大模型榜單！UIUC發布StarCoder-15B-Instruct

新智元報道編輯：LRT 【新智元導讀】通過StarCoder2-15B生成數千個指令-響應對，直接對StarCoder-15B基座模型進行微調，無需依賴昂貴的人工標注數據，也無需...

閱讀原文

AIGC動態

2年前 (2024)

我是如何贏得GPT-4提示工程大賽冠軍的

選自towardsdatascience 作者：Sheila Teo 機器之心編譯機器之心編輯部去年 11 月 8 日，新加坡政府科技局（GovTech）組織舉辦了首屆 GPT-4 提示工程（Promp...

閱讀原文

AIGC動態

2年前 (2024)

只需百行代碼，讓H100提速30%，斯坦福開源全新AI加速框架

機器之心報道機器之心編輯部提高 GPU 利用率，就是這么簡單。AI 的快速發展，伴隨而來的是大計算量。這就自然而然的引出了一個問題：如何減少 AI 對計算的需...

閱讀原文

AIGC動態

2年前 (2024)

中電信AI大模型TeleChat-12B評測：使用3T tokens預訓練，已開源！

直播預告 | 5月14日晚7點，「智猩猩、AI新青年講座」第235講正式開講，慕尼黑工業大學視覺實驗室陳振宇博士將直播講解《三維室內場景紋理圖生成》歡迎掃碼報...

閱讀原文

AIGC動態

2年前 (2024)

今日arXiv最熱NLP大模型論文：對指令太敏感？山東大學提出一致性對齊法，治好大模型敏感體質！

夕小瑤科技說原創作者 | Axe_越不知道大家在使用大語言模型（LLM）的時候有沒有遇到過，明明一模一樣的意思，哪怕只有一兩個字不同的指令給到大模型后，都會...

閱讀原文

AIGC動態

2年前 (2024)

清華SuperBench全球測評出爐，Claude 3拿下多個冠軍！合成數據才是人類未來？

新智元報道編輯：好困 Aeneas 【新智元導讀】清華大學SuperBench團隊的新一輪全球大模型評測中，Claude 3依然強到發指。在技術報告中，有人發現了Claude 3的...

閱讀原文

AIGC動態

2年前 (2024)

「用 AI 訓 AI」這事靠譜嗎？

來源：節選自2024 年 Week04業內通訊在大語言模型領域，微調是改進模型的重要步驟。伴隨開源模型數量日益增多，針對LLM的微調方法同樣在推陳出新。 2024年初...

閱讀原文

AIGC動態

2年前 (2024)

蘋果一次性開源了8個大模型！包含模型權重、訓練日志和設置，OpenELM全面開源

夕小瑤科技說原創作者 | 任同學不以開放性著稱的蘋果居然同時開源了大模型的權重、訓練和評估框架，涵蓋訓練日志、多個保存點和預訓練設置。同時升級計算機...

閱讀原文

AIGC動態

2年前 (2024)

蘋果OpenELM：設備瞬間變聰明，自家AI無需聯網也能用

點擊上方藍字關注我們“蘋果推出OpenELM，一系列開源大型語言模型可在設備端獨立運行，無需云端支持。包含8款模型，參數規模2700萬至30億，部分預訓練與指令調...

閱讀原文

AIGC動態

2年前 (2024)

開源大模型Llama 3王者歸來！最大底牌4000億參數，性能直逼GPT-4

機器之心報道機器之心編輯部扎克伯格：「有了 Llama 3，全世界就能擁有最智能的 AI。」 ChatGPT 拉開了大模型競賽的序幕，Meta 似乎要后來居上了。本周四，...

閱讀原文

AIGC動態

2年前 (2024)

全球首個「開源GPT-4」出世！Llama 3震撼發布，Meta AI免登錄可用

新智元報道編輯：編輯部【新智元導讀】蟄伏許久，Meta剛剛扔出了重磅炸彈：大家期待已久的Llama 3，用了24000塊GPU訓練，一亮相便登上開源大模型鐵王座。8B...

閱讀原文

AIGC動態

2年前 (2024)

H800竟然能白嫖了！還能一鍵部署Open Sora，潞晨云YYDS！

ChatGPT和Sora等AI大模型應用，將AI大模型和算力需求的熱度不斷帶上新的臺階。如何獲得廉價算力，進行AI視頻生成等模型開發和應用呢？前不久，潞晨科技全面...

閱讀原文

AIGC動態

2年前 (2024)

今日arXiv最熱NLP大模型論文：斯坦福發布法律指令數據集LawInstruct，統一17個轄區24種語言

夕小瑤科技說原創作者 | Tscom引言：法律領域的語言模型挑戰與進展在法律領域，語言模型（Language Models, LLMs）的發展一直面臨著獨特的挑戰。法律文本的...

閱讀原文

AIGC動態

2年前 (2024)

1…3 456 7…11