標簽:語言

Google DeepMind 最新研究:搞定這三個任務?人類不行,AI 也不行

撰文 | 趙雅琦前言人工智能(AI)并非完美的推理者,即使是當前大熱的語言模型(LMs),也同樣會表現出與人類類似的錯誤傾向,尤其是出現顯著的“內容效應”(C...
閱讀原文

Ilya Sutskever 離職后首次采訪:個人經歷,Scaling Laws,AI幻覺

來源:AI寒武紀 Ilya Sutskever自從 OpenAI 趕走 Sam Altman 后首次接受播客采訪,他提到了 AI 和深度學習的過去、現在和未來。他回顧了他從 17 歲起與 Jeff ...
閱讀原文

「后訓練 + STaR」是 OpenAI 絕密項目「草莓」背后的秘密嗎?

機器之心PRO · 會員通訊 Week 29---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. 「后訓練 + STaR」是 OpenAI 絕密項目「草莓」背后的秘...
閱讀原文

KDD 2024|港大黃超團隊深度解析大模型在圖機器學習領域的「未知邊界」

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

【阿姆斯特丹博士論文】以實體為中心的神經模型用于自然語言處理

來源:專知 這篇論文探討了如何通過將實體信息納入神經網絡模型來增強自然語言理解。它解決了三個關鍵問題: 利用實體進行理解任務:本文引入了Entity-GCN模...
閱讀原文

創業者復盤:出海“本地化”過程中,我犯了哪些錯?

本文作者楊杰是一位產品經理出身的創業者,所在團隊從2019 年開始做國內 SAAS 業務,2022年觀察到國內業務出現瓶頸,開始尋求第二增長曲線。 2022年4月,產品...
閱讀原文

清華大合斯坦福大學提出混合注意力機制MoA,大模型解碼速率提高6倍

夕小瑤科技說 原創作者 | Richard 隨著大語言模型的規模不斷擴大,如何在保持模型性能的同時提高其效率,成為了當前研究的熱點問題。最近,清華大學聯合斯坦...
閱讀原文

對話南洋理工大學安波教授:如何讓大語言模型適應動態環境?

大數據文摘受權轉載自AI科技評論 作者丨陳鷺伊 編輯丨岑峰 對人類越是簡單的問題,大語言模型反而越難以做好? 盡管現在的大模型已經有能力沖擊數學競賽級別...
閱讀原文

對話南洋理工大學安波教授:如何讓大語言模型適應動態環境?丨IJAIRR

智能體實現AGI的自我超越,從與環境交互做起。作者丨陳鷺伊 編輯丨岑峰 對人類越是簡單的問題,大語言模型反而越難以做好? 盡管現在的大模型已經有能力沖擊...
閱讀原文

上海AI lab開源LLaMAX,用3.5萬小時的A100訓練讓大模型掌握上百種語言翻譯

夕小瑤科技說 原創作者 | Richard 在這個AI大爆發的時代,各種智能工具如雨后春筍般涌現,大語言模型的能力也在不斷刷新我們的認知。隨便拉出一個AI模型,似...
閱讀原文

無損加速最高5x,EAGLE-2讓RTX 3060的生成速度超過A100

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

拋棄視覺編碼器,這個「原生版」多模態大模型也能媲美主流方法

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

初創公司硬剛英偉達:在AMD卡上模擬CUDA,原版程序直接編譯運行

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI無需任何修改轉換,AMD顯卡也跑起原版CUDA程序了! 英國一家初創公司,推出了針對AMD的CUDA程序編譯工具,而且免費...
閱讀原文

大語言模型的前世今生:萬字長文完整梳理所有里程碑式大語言模型(LLMs)

點擊下方卡片,關注“AI生成未來” >>后臺回復“GAI”,免費獲取AI行業報告和資料! 作者:APlayBoy編輯:AI生成未來 鏈接:https://zhuanlan.zhihu.com/p/...
閱讀原文

阿里開源語音處理模型 FunAudioLLM :50 種語言無縫翻譯,還能識別語音情緒

作者 | 趙明華 阿里巴巴通義實驗室近日發布并開源了 FunAudioLLM,這是一個旨在增強人與大型語言模型(LLMs)之間自然語音交互的框架,代表了語音處理領域的...
閱讀原文
15678929