標簽:研究人員
next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+
新智元報道編輯:LRS 【新智元導讀】研究人員提出了一種新的大型語言模型訓練方法,通過一次性預測多個未來tokens來提高樣本效率和模型性能,在代碼和自然語...
人工智能在心理測試理論方面勝過人類
STUART BRADFORD 來源:IEEE電氣電子工程師學會 心智理論(Theory of Mind,https://www.simplypsychology.org/theory-of-mind.html)——追蹤他人心理狀態的能...
ChatGPT如何「思考」?心理學和神經科學AI大模型,Nature發文
來源:ScienceAI 編輯:X 美國東北大學的計算機科學家David Bau 非常熟悉這樣一個想法:計算機系統變得如此復雜,以至于很難跟蹤它們的運行方式。 「我做了 2...
迪士尼機器人再秀神操作,用火箭上天,還能精準著陸!
大數據文摘受權轉載自機器人大講堂 注意看,這個機器人從天而降,不僅沒有摔得粉身碎骨,還能穩穩站立。過程中噴射出水柱并不是在表演,而是因為用的水火箭來...
GPT-4通過圖靈測試,勝率高達54%!UCSD新作:人類無法認出GPT-4
新智元報道編輯:桃子庸庸 【新智元導讀】GPT-4通過圖靈測試了!UCSD研究團隊通過實證研究,人類無法將GPT-4與人類進行區分。而且,有54%的情況下,它被判定...
僅靠開源數據復刻出LLaMA3指令學習效果,在線迭代RLHF全流程解決方案來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Nature深度|揭秘ChatGPT是如何“思考”的
來源:圖靈人工智能 內容來自:Nature 原文作者:Matthew Hutson 原文鏈接:https://www.nature.com/articles/d41586-024-01314-y 編譯:喬治 計算機系統正變...
MIT等驚人發現:全世界AI已學會人類!背刺人類盟友,佯攻擊敗99.8%玩家
新智元報道編輯:桃子 【新智元導讀】AI系統越來越擅長欺騙、操作人類了。最近,來自MIT、ACU等機構的研究人員通過各種實例研究發現, AI在各類游戲中,通過...
思維鏈不存在了?紐約大學最新研究:推理步驟可「省略」
新智元報道編輯:alan 【新智元導讀】思維鏈技術,可能要被推翻了!來自紐約大學的最新研究表明:大模型并沒有利用思維鏈的推理能力,它只是偷偷加了計算!紅...
大神Karpathy強推,分詞領域必讀:自動釣魚讓大模型“發瘋”的token,來自Transformer作者創業公司
魚羊 發自 凹非寺量子位 | 公眾號 QbitAI關于大模型分詞(tokenization),大神Karpathy剛剛推薦了一篇必讀新論文。 主題是:自動檢測大模型中那些會導致“故...
Nature | 突破性進展:AlphaFold3引領結構生物學進入新時代
來源:生物探索(轉載請注明來源) 責編:探索君 排版:探索君 引言在當前的科技浪潮中,人工智能(Artificial Intelligence, AI)正以前所未有的速度和規模...
AlphaGo核心算法增強,7B模型數學能力直逼GPT-4,阿里大模型新研究火了
魚羊 發自 凹非寺量子位 | 公眾號 QbitAI把AlphaGo的核心算法用在大模型上,“高考”成績直接提升了20多分。 在MATH數據集上,甚至讓7B模型得分超過了GPT-4。 ...
微調和量化竟會增加越獄風險!Mistral、Llama等無一幸免
新智元報道編輯:alan 【新智元導讀】大模型的安全漏洞又填一筆!最新研究表明,對任何下游任務進行微調和量化都可能會影響LLM的安全性,即使本身并沒有惡意...
開源15T tokens!HuggingFace放出規模最大、質量最高預訓練數據集
新智元報道編輯:LRS 【新智元導讀】FineWeb是一個高質量的預訓練數據集,包含15T+個tokens,主要包含英語文本;消融實驗證明了FineWeb數據集的質量要高于其...
美國高校:在超半數AI熱門領域,中國研究已領先于美國
這些發現揭示了中美在引領AI進步方面的重要差別。 編譯|ZeR0 編輯|漠影 智東西5月4日消息,根據美國喬治城大學安全與新興技術中心(CSET)向Axios分享的新數...