標簽:問題

AI海洋中的海妖之歌:騰訊AI Lab大模型幻覺問題綜述

機器之心專欄機器之心編輯部在古希臘的神話中,有一種名為塞壬 (Serin) 的海妖,她們通過美麗的歌喉制造幻像,誘導往來的船只觸礁沉沒。大規模語言模型在眾多...
閱讀原文

人紅是非多!Rust社區沖突不斷,創始人:別Call我了,我也救不了!

編譯 | Tina、核子可樂 Rust 為什么會有這么多管理上的問題?如果 Rust 采用由創始人治理方式,會不會更好?實際上,Rust 的創造者 Graydon Hoare 曾從側面回...
閱讀原文

Meta計劃曝光:下一個大模型以GPT-4為標準,2024年開始訓練

機器之心報道編輯:陳萍隨著技術競賽的升級,Meta 更強大的 AI 系統正在研發當中。在 AI 研究這一領域,Meta 可謂是走在了眾多科技公司的前列。自年初以來,...
閱讀原文

大模型為啥這么慢,原來是想多了:新方向是和人一樣的思維算法

機器之心報道編輯:Panda組合人類推理之精妙與算法方法之精準,思維算法可助力 LLM 解決復雜問題。人類直覺是一種常被 AI 研究者忽視的能力,但其精妙程度連...
閱讀原文

強!谷歌DeepMind新論文放出大語言模型最佳提示詞,由AI設計效果超人類

夕小瑤科技說 分享來源 | 量子位提示詞中加上“深呼吸”,AI大模型數學成績就能再漲8.4分!谷歌DeepMind團隊最新發現,用這個新“咒語”(Take a deep breath)結...
閱讀原文

大模型的“幻覺”如何克服?騰訊AILab等《大型語言模型中的幻覺》,全面闡述檢測、解釋和減輕幻覺

來源:專知理解大模型中的“幻覺”,這篇論文及時解讀。雖然大型語言模型(LLMs)在各種下游任務中展示出了卓越的能力,但一個重要的關注點是它們表現出幻覺的...
閱讀原文

大模型靠“深呼吸”數學再漲8分!谷歌DeepMind發現AI自己設計提示詞效果勝人類

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI提示詞中加上“深呼吸”,AI大模型數學成績就能再漲8.4分!谷歌DeepMind團隊最新發現,用這個新“咒語”(Take a deep br...
閱讀原文

谷歌CEO桑達爾·皮查伊:谷歌25周歲,搜索仍是核心,AI是最大變革

谷歌CEO 桑達爾·皮查伊來源:https://blog.google/inside-google/message-ceo/google-25th-birthday-sundar-pichai/作者:桑達爾·皮查伊責編:王紫薇1998年9...
閱讀原文

GPT-4:我寫的代碼你敢用嗎?研究表明其API誤用率超過62%

機器之心報道編輯:Panda W現在,已經有不少軟件開發者在開發軟件時讓大型語言模型當助手了,但最新的一項研究發出了警示:使用 LLM 反饋的代碼時一定要慎重...
閱讀原文

GitHub熱榜登頂:開源版GPT-4代碼解釋器,可安裝任意Python庫,本地終端運行

克雷西 發自 凹非寺量子位 公眾號 | QbitAIChatGPT的代碼解釋器,用自己的電腦也能運行了。剛剛有位大神在GitHub上發布了本地版的代碼解釋器,很快就憑借3k+...
閱讀原文

陶哲軒用大模型輔助解決數學問題:生成代碼、編輯LaTeX公式都很好用

機器之心報道編輯:小舟數學研究工具可以隨 AI 模型的進展更新一波了。幾個月來,數學家陶哲軒多次嘗試使用 ChatGPT 輔助解決數學問題,并與大家分享他的試驗...
閱讀原文

「不要回答」,數據集來當員,評估LLM安全機制就靠它了

機器之心專欄機器之心編輯部葉文潔打開結果文件,人類第一次讀到了來自宇宙中另一個世界的信息,其內容出乎所有人的想象,它是三條重復的警告:不要回答!不...
閱讀原文

GPT-4寫代碼不如ChatGPT,誤用率高達62%!加州大學兩位華人開源代碼可靠性基準RobustAPI

新智元報道編輯:LRS【新智元導讀】代碼能否跑起來的不是判斷可靠性的標準,用語言模型寫代碼還需要考慮生產環境下的預期外輸入。大型語言模型(LLM)在理解...
閱讀原文

混合精度下位置編碼竟有大坑,llama 等主流開源模型紛紛中招!百川智能給出修復方案

作者 | 百川智能 位置編碼技術是一種能夠讓神經網絡建模句子中 Token 位置信息的技術。在 Transformer 大行其道的時代,由于 Attention 結構無法建模每個 tok...
閱讀原文

陶哲軒:GPT-4神助攻,寫Python代碼輕松省半小時

新智元報道編輯:Aeneas 好困【新智元導讀】陶哲軒早就預言,2026年GPT能幫數學家合著論文。今天,GPT-4就幫他寫出一段代碼,直接節省了半小時的工作量。剛剛...
閱讀原文
133343536