標簽:語言
沒想到!AlphaZero式樹搜索也能用來增強大語言模型推理與訓練
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Meta AI推出適用于移動設備的緊湊型語言模型
點擊上方藍字關注我們“Meta AI 推出 MobileLLM,一種為移動設備設計的高效語言模型。該模型通過優化參數,實現了與更大模型相當的性能,推動了 AI 模型小型化...
ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%
新智元報道編輯:編輯部 【新智元導讀】6月,IEEE刊登了一篇對ChatGPT代碼生成任務進行系統評估的論文,數據集就是程序員們最愛的LeetCode題庫。研究揭示了LL...
LLM用于時序預測真的不行,連推理能力都沒用到
機器之心報道 編輯:panda語言模型真的能用于時序預測嗎?根據貝特里奇頭條定律(任何以問號結尾的新聞標題,都能夠用「不」來回答),答案應該是否定的。事...
全新TextGrad框架:用GPT-4o作引擎,自動優化端到端任務
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
73年前,香農已經給大模型發展埋下一顆種子
機器之心報道 編輯:澤南、杜偉AI 考古,追溯到了祖師爺頭上。當今 AI 領域爆火的大語言模型(LLM),其原理是香農提出來的? 今天,普林斯頓大學教授承現峻...
免費AI神器!對照翻譯帶公式圖表識別,支持批量識別
各位小伙伴們,今天重點介紹一款免費神器,名字為Doc2X,可以在線使用和下載客戶端使用, 以及有多種第三方插件和pip包等,所有功能全部免費,下面具體展開介...
ICML 2024 Spotlight | 在解碼中重新對齊,讓語言模型更少幻覺、更符合人類偏好
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Nature 熱議論文證明「語言不是思考工具」,LLM 可能要學不會推理了?
機器之心PRO · 會員通訊 Week 26---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. Nature 熱議論文證明「語言不是思考工具」,LLM 可能要...
“小語言模型”或成為龐大人工智能選項的替代品
ISTOCK 來源:IEEE電氣電子工程師學會 科技公司已經陷入了建立大型語言模型(LLM,https://spectrum.ieee.org/ai-index-2024)的競爭中。例如,今年4月,Meta...
今日arXiv最熱大模型論文:大模型對齊告別微調,直接編輯表征空間即可解決
夕小瑤科技說 原創作者 | Richard人工智能技術正在飛速發展,尤其是大語言模型在自然語言處理領域取得了令人矚目的成就。但同時,我們也面臨著如何讓語言模型...
語言≠思維,大模型學不了推理:一篇Nature讓AI社區炸鍋了
機器之心報道 機器之心編輯部方向完全搞錯了?大語言模型(LLM)為什么空間智能不足,GPT-4 為什么用語言以外的數據訓練,就能變得更聰明?現在這些問題有 「...
墻裂推薦!Karpathy大模型培訓課LLM101n上線了,非常基礎
機器之心報道 機器之心編輯部讓我們訓練一個 Storyteller。今天外網又被 Andrej Karpathy 這一良心課程刷屏了! 項目是 11 小時前被 Karpathy 上傳到 Github ...
智源獨家丨謝賽寧:AI是否需要更強的視覺基礎來實現理解和意義?
來源:智源社區 6 月 15 日,萬眾矚目的智源大會「多模態大模型」論壇轟動舉行。紐約大學助理教授謝賽寧從哲學的角度出發,針對大語言時代的視覺表征研究娓娓...
從 CLM 啟航:中國大模型的探索與未來
CLM大會不僅是大模型“上半場”的歸納總結,更是拉開了“下半場”中國大模型道路的探索的序幕。作者丨陳鷺伊 編輯丨岑峰 在人工智能的廣闊舞臺上,大模型技術的崛...
粵公網安備 44011502001135號