標(biāo)簽:語言

沒想到!AlphaZero式樹搜索也能用來增強大語言模型推理與訓(xùn)練

AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

Meta AI推出適用于移動設(shè)備的緊湊型語言模型

點擊上方藍(lán)字關(guān)注我們“Meta AI 推出 MobileLLM,一種為移動設(shè)備設(shè)計的高效語言模型。該模型通過優(yōu)化參數(shù),實現(xiàn)了與更大模型相當(dāng)?shù)男阅埽苿恿?AI 模型小型化...
閱讀原文

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%

新智元報道編輯:編輯部 【新智元導(dǎo)讀】6月,IEEE刊登了一篇對ChatGPT代碼生成任務(wù)進(jìn)行系統(tǒng)評估的論文,數(shù)據(jù)集就是程序員們最愛的LeetCode題庫。研究揭示了LL...
閱讀原文

LLM用于時序預(yù)測真的不行,連推理能力都沒用到

機器之心報道 編輯:panda語言模型真的能用于時序預(yù)測嗎?根據(jù)貝特里奇頭條定律(任何以問號結(jié)尾的新聞標(biāo)題,都能夠用「不」來回答),答案應(yīng)該是否定的。事...
閱讀原文

全新TextGrad框架:用GPT-4o作引擎,自動優(yōu)化端到端任務(wù)

AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

73年前,香農(nóng)已經(jīng)給大模型發(fā)展埋下一顆種子

機器之心報道 編輯:澤南、杜偉AI 考古,追溯到了祖師爺頭上。當(dāng)今 AI 領(lǐng)域爆火的大語言模型(LLM),其原理是香農(nóng)提出來的? 今天,普林斯頓大學(xué)教授承現(xiàn)峻...
閱讀原文

免費AI神器!對照翻譯帶公式圖表識別,支持批量識別

各位小伙伴們,今天重點介紹一款免費神器,名字為Doc2X,可以在線使用和下載客戶端使用, 以及有多種第三方插件和pip包等,所有功能全部免費,下面具體展開介...
閱讀原文

ICML 2024 Spotlight | 在解碼中重新對齊,讓語言模型更少幻覺、更符合人類偏好

AIxiv專欄是機器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

Nature 熱議論文證明「語言不是思考工具」,LLM 可能要學(xué)不會推理了?

機器之心PRO · 會員通訊 Week 26---- 本周為您解讀 ③個值得細(xì)品的AI & Robotics業(yè)內(nèi)要事 ---- 1. Nature 熱議論文證明「語言不是思考工具」,LLM 可能要...
閱讀原文

“小語言模型”或成為龐大人工智能選項的替代品

ISTOCK 來源:IEEE電氣電子工程師學(xué)會 科技公司已經(jīng)陷入了建立大型語言模型(LLM,https://spectrum.ieee.org/ai-index-2024)的競爭中。例如,今年4月,Meta...
閱讀原文

今日arXiv最熱大模型論文:大模型對齊告別微調(diào),直接編輯表征空間即可解決

夕小瑤科技說 原創(chuàng)作者 | Richard人工智能技術(shù)正在飛速發(fā)展,尤其是大語言模型在自然語言處理領(lǐng)域取得了令人矚目的成就。但同時,我們也面臨著如何讓語言模型...
閱讀原文

語言≠思維,大模型學(xué)不了推理:一篇Nature讓AI社區(qū)炸鍋了

機器之心報道 機器之心編輯部方向完全搞錯了?大語言模型(LLM)為什么空間智能不足,GPT-4 為什么用語言以外的數(shù)據(jù)訓(xùn)練,就能變得更聰明?現(xiàn)在這些問題有 「...
閱讀原文

墻裂推薦!Karpathy大模型培訓(xùn)課LLM101n上線了,非常基礎(chǔ)

機器之心報道 機器之心編輯部讓我們訓(xùn)練一個 Storyteller。今天外網(wǎng)又被 Andrej Karpathy 這一良心課程刷屏了! 項目是 11 小時前被 Karpathy 上傳到 Github ...
閱讀原文

智源獨家丨謝賽寧:AI是否需要更強的視覺基礎(chǔ)來實現(xiàn)理解和意義?

來源:智源社區(qū) 6 月 15 日,萬眾矚目的智源大會「多模態(tài)大模型」論壇轟動舉行。紐約大學(xué)助理教授謝賽寧從哲學(xué)的角度出發(fā),針對大語言時代的視覺表征研究娓娓...
閱讀原文

從 CLM 啟航:中國大模型的探索與未來

CLM大會不僅是大模型“上半場”的歸納總結(jié),更是拉開了“下半場”中國大模型道路的探索的序幕。作者丨陳鷺伊 編輯丨岑峰 在人工智能的廣闊舞臺上,大模型技術(shù)的崛...
閱讀原文
167891029