標簽:提示

一個小技巧,解鎖ChatGPT「預測未來」?

新智元報道編輯:Mindy 【新智元導讀】新研究利用了ChatGPT在2021年9月的訓練數據截止這一限制,比較了ChatGPT在直接預測和未來敘事預測兩種不同提示方式下,...
閱讀原文

微調和量化竟會增加越獄風險!Mistral、Llama等無一幸免

新智元報道編輯:alan 【新智元導讀】大模型的安全漏洞又填一筆!最新研究表明,對任何下游任務進行微調和量化都可能會影響LLM的安全性,即使本身并沒有惡意...
閱讀原文

Llama 3細節公布!AI產品總監站臺講解:Llama系列超龐大生態系統

新智元報道編輯:LRS 【新智元導讀】除了計算資源和訓練數據這些硬實力外,Llama 3模型開源的訓練思路覆蓋了LLM模型的全部生命周期,提供了各種開源生態系統...
閱讀原文

神秘大模型一夜刷屏,能力太強被疑GPT-4.5,奧特曼避而不答打啞謎

夢晨 明敏 發自 凹非寺量子位 | 公眾號 QbitAI一夜之間,大模型話題王,再次易主。 一個神秘模型突然殺入眾人視野,能力超越一眾開源模型,甚至包括GPT-4。幾...
閱讀原文

完整指南!如何在Visual Studio Code中輕松運行Llama 3模型

Meta 發布了最新的開源語言模型Llama 3。因為它是開源的,你可以下載這個模型,并在自己的電腦上運行。 我清楚,你可能會想,在個人筆記本上運行一個擁有80億...
閱讀原文

阿里智能體“組裝工廠”開源!0經驗搞定上萬Agent并發

阿里巴巴通義實驗室 投稿量子位 | 公眾號 QbitAI讓多智能體開發就像搭積木,阿里巴巴通義實驗室開源多智能體編程框架與開發平臺AgentScope。 該平臺專門為多...
閱讀原文

CVPR 2024 | 基于MoE的通用圖像融合模型,添加2.8%參數完成多項任務

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

我處理了 5 億 GPT tokens 后:langchain、RAG 等都沒什么用

作者 | KEN KANTZER 譯者 | 平川 策劃 | 褚杏娟 本文最初發布于 KEN KANTZER 的個人博客。 在過去的六個月里,我的創業公司 Truss(gettruss.io)發布了多項...
閱讀原文

開箱黑盒LLM!谷歌大一統框架Patchscopes實戰教程來了

新智元報道編輯:LRS 【新智元導讀】大模型最為人詬病的問題就是不透明、不可解釋。谷歌的最新框架Patchscopes可以提供關于模型內部隱藏表征的自然語言解釋,...
閱讀原文

新測試基準發布,最強開源Llama 3尷尬了

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI如果試題太簡單,學霸和學渣都能考90分,拉不開差距…… 隨著Claude 3、Llama 3甚至之后GPT-5等更強模型發布,業界急需...
閱讀原文

今日arXiv最熱NLP大模型論文:微軟發布可視思維鏈VoT,提高大模型空間想象力

夕小瑤科技說 原創作者 | 芒果 引言:思維可視化技術的探索此項研究提出了一種名為思維可視化(VoT)的技術,旨在通過可視化大型語言模型(LLMs)的推理過程來增...
閱讀原文

Stable Diffusion 3 API 發布!超越Midjourney v6和DALL-E 3

夕小瑤科技說 原創作者 | 任同學Stable Diffusion 3 于 2 月首次宣布作為預覽版發布。而今天,StabilityAI 正式推出了 Stable Diffusion 3 和 Stable Diffusi...
閱讀原文

「音樂界Sora」Udio來了:前DeepMind員工創業,比Suno可定制性更強

機器之心報道 機器之心編輯部我們已經看到,AI 已經能夠理解和生成文本、圖像、視頻,盡管各個產品目前能達到的準確性和審美水準還不相同。 自帶曲譜的音樂生...
閱讀原文

GPT-4推理能力為0?開發者懸賞1萬美金被打臉,神秘提示正確率直沖100%

新智元報道編輯:Aeneas 好困 【新智元導讀】小孩子都會的腦筋急轉彎推理題,GPT-4和Claude 3做不出?國外一位開發者小哥堅稱這一觀點,認為GPT模型在訓練集...
閱讀原文

多模態大模型有了統一分割框架,華科PSALM多任務登頂,模型代碼全開源

機器之心專欄 機器之心編輯部最近,多模態大模型(LMM)取得了一系列引人注目的成就,特別是在視覺 - 語言任務上的表現令人矚目。它們的成功不僅展現了多模態...
閱讀原文
1789101120