標簽:指令
OpenAI把GPT-4原始版給了他們:研究不微調只靠提示詞能走多遠
夢晨 發自 凹非寺量子位 | 公眾號 QbitAI除了OpenAI自己,居然還有別人能用上GPT-4-Base版?? 也就是未經微調的預訓練版,還不會對話聊天,只會補全句子的模...
用GPT-3.5生成數據集!北大天工等團隊圖像編輯新SOTA,可精準模擬物理世界場景
楊靈 投稿量子位 | 公眾號 QbitAI高質量圖像編輯的方法有很多,但都很難準確表達出真實的物理世界。 那么,Edit the World試試。 來自北京大學、Tiamat AI、...
無需OpenAI數據,躋身代碼大模型榜單!UIUC發布StarCoder-15B-Instruct
新智元報道編輯:LRT 【新智元導讀】通過StarCoder2-15B生成數千個指令-響應對,直接對StarCoder-15B基座模型進行微調,無需依賴昂貴的人工標注數據,也無需...
我是如何贏得GPT-4提示工程大賽冠軍的
選自towardsdatascience 作者:Sheila Teo 機器之心編譯 機器之心編輯部去年 11 月 8 日,新加坡政府科技局(GovTech)組織舉辦了首屆 GPT-4 提示工程(Promp...
只需百行代碼,讓H100提速30%,斯坦福開源全新AI加速框架
機器之心報道 機器之心編輯部提高 GPU 利用率,就是這么簡單。AI 的快速發展,伴隨而來的是大計算量。這就自然而然的引出了一個問題:如何減少 AI 對計算的需...
中電信AI大模型TeleChat-12B評測:使用3T tokens預訓練,已開源!
直播預告 | 5月14日晚7點,「智猩猩、AI新青年講座」第235講正式開講,慕尼黑工業大學視覺實驗室陳振宇博士將直播講解《三維室內場景紋理圖生成》歡迎掃碼報...
今日arXiv最熱NLP大模型論文:對指令太敏感?山東大學提出一致性對齊法,治好大模型敏感體質!
夕小瑤科技說 原創作者 | Axe_越不知道大家在使用大語言模型(LLM)的時候有沒有遇到過,明明一模一樣的意思,哪怕只有一兩個字不同的指令給到大模型后,都會...
清華SuperBench全球測評出爐,Claude 3拿下多個冠軍!合成數據才是人類未來?
新智元報道編輯:好困 Aeneas 【新智元導讀】清華大學SuperBench團隊的新一輪全球大模型評測中,Claude 3依然強到發指。在技術報告中,有人發現了Claude 3的...
「用 AI 訓 AI」這事靠譜嗎?
來源:節選自2024 年 Week04業內通訊在大語言模型領域,微調是改進模型的重要步驟。伴隨開源模型數量日益增多,針對LLM的微調方法同樣在推陳出新。 2024年初...
蘋果一次性開源了8個大模型! 包含模型權重、訓練日志和設置,OpenELM全面開源
夕小瑤科技說 原創作者 | 任同學不以開放性著稱的蘋果居然同時開源了大模型的權重、訓練和評估框架,涵蓋訓練日志、多個保存點和預訓練設置。同時升級計算機...
蘋果OpenELM:設備瞬間變聰明,自家AI無需聯網也能用
點擊上方藍字關注我們“蘋果推出OpenELM,一系列開源大型語言模型可在設備端獨立運行,無需云端支持。包含8款模型,參數規模2700萬至30億,部分預訓練與指令調...
開源大模型Llama 3王者歸來!最大底牌4000億參數,性能直逼GPT-4
機器之心報道 機器之心編輯部扎克伯格:「有了 Llama 3,全世界就能擁有最智能的 AI。」 ChatGPT 拉開了大模型競賽的序幕,Meta 似乎要后來居上了。 本周四,...
全球首個「開源GPT-4」出世!Llama 3震撼發布,Meta AI免登錄可用
新智元報道編輯:編輯部 【新智元導讀】蟄伏許久,Meta剛剛扔出了重磅炸彈:大家期待已久的Llama 3,用了24000塊GPU訓練,一亮相便登上開源大模型鐵王座。8B...
H800竟然能白嫖了!還能一鍵部署Open Sora,潞晨云YYDS!
ChatGPT和Sora等AI大模型應用,將AI大模型和算力需求的熱度不斷帶上新的臺階。 如何獲得廉價算力,進行AI視頻生成等模型開發和應用呢? 前不久,潞晨科技全面...
今日arXiv最熱NLP大模型論文:斯坦福發布法律指令數據集LawInstruct,統一17個轄區24種語言
夕小瑤科技說 原創作者 | Tscom引言:法律領域的語言模型挑戰與進展在法律領域,語言模型(Language Models, LLMs)的發展一直面臨著獨特的挑戰。法律文本的...
粵公網安備 44011502001135號