標簽:語言
手機秒變超腦!微軟Phi-3已經超越主流大模型!
點擊上方藍字關注我們“微軟phi-3系列語言模型,尤其phi-3-mini,憑借創新數據集(精選網絡數據與合成數據)和高效訓練,實現小模型媲美Mixtral 8x7B、GPT-3.5...
今日arXiv最熱NLP大模型論文:浙江大學:蒸一蒸,多Agent變成單一模型,效果更好
夕小瑤科技說 原創作者 | 謝年年“團結就是力量”,面對復雜多變的現實環境,multi-agent應運而生。相較于單打獨斗的single-agent,multi-agent集結了多個功能...
首個基于Mamba的MLLM來了!模型權重、訓練代碼等已全部開源
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
Transformer本可以深謀遠慮,但就是不做
機器之心報道 機器之心編輯部語言模型是否會規劃未來 token?這篇論文給你答案。 「別讓 Yann LeCun 看見了。」Yann LeCun 表示太遲了,他已經看到了。今天要...
生成式人工智能“瘦身”,進入便攜消費電子產品
下一代親密聊天機器人將在不需要連接互聯網的情況下,以光速在個人筆記本電腦上運行。 這至少是英特爾首席執行官帕特?格爾辛格(Pat Gelsinger)在2023年英特...
看懂網飛版「三體」!Reka Core登場:挑戰GPT-4、Claude 3
新智元報道編輯:flynne 【新智元導讀】AI初創公司Reka最新推出的多模態語言模型Reka Core具備理解圖像、音頻和視頻等多種模式數據內容的驚人能力,是繼谷歌...
AI模型中文排名出爐!國產模型竟然…
點擊上方藍字關注我們“LMSYS Chatbot Arena的最新排名顯示,中文模型意外地落后于其他模型,顛覆了人們對國產AI的預期。這一結果引發了對中文自然語言處理能...
OpenAI 創始成員用 1000 行 C 代碼手搓了一個大模型,Mac 即可運行!網友:真男人就該用C編程
編譯 | 核子可樂、Tina徒手用 1000 行 C 語言實現,不依賴龐大的外部庫,Mac 即可運行。 如今這年頭,徒手寫神經網絡代碼已經不算事兒了,現在流行手搓大模...
誰說大象不能起舞! 重編程大語言模型實現跨模態交互的時序預測 | ICLR 2024
機器之心專欄 機器之心編輯部最近,來自澳大利亞蒙納士大學、螞蟻集團、IBM 研究院等機構的研究人員探索了模型重編程 (model reprogramming) 在大語言模型 (L...
綜述 | 清華大學劉知遠團隊剖析大語言模型時代的社會機遇與挑戰
大語言模型時代的社會機遇與挑戰 陳慧敏,劉知遠,孫茂松摘要大語言模型ChatGPT因其高度通用化和智能化的表現受到廣泛社會關注,其引發的技術革命也正逐漸延...
凱文凱利2024最新演講:幫助人類成為更好的人類,是人工智能的最終目標
3月29日,中信出版集團聯合上海交通大學上海高級金融學院邀請到凱文凱利(K.K.)來到中國,展開一場精彩的線下對談。讀者們熟悉的K.K.,是《連線》雜志的創始...
為什么要純C語言手搓GPT-2,Karpathy回應網友質疑
機器之心報道 編輯:小舟Karpathy:for fun.幾天前,前特斯拉 Autopilot 負責人、OpenAI 科學家 Andrej Karpathy 發布了一個僅用 1000 行代碼即可在 CPU/fp32...
大模型做時序預測也很強!華人團隊激活LLM新能力,超越一眾傳統模型實現SOTA
蔚明 投稿自 凹非寺量子位 | 公眾號 QbitAI大語言模型潛力被激發—— 無需訓練大語言模型就能實現高精度時序預測,超越一切傳統時序模型。 來自蒙納士大學、螞...
高薪必看:如何編寫對大模型友好的代碼? | 極客時間
在最近的紅杉 AI 峰會上,吳恩達教授深入剖析了 Agent Workflow 及其與大語言模型(LLM)結合的潛力。他提出,通過智能代理自動化任務,不僅能優化工作流程,...
1000行C語言搓出GPT-2!AI大神Karpathy新項目剛上線就狂攬2.5k星
新智元報道編輯:桃子 好困 【新智元導讀】訓大模型的方法可能要被革新了!AI大神Karpathy發布的新項目僅用1000行的C語言訓完GPT-2,而不再依賴龐大的GPT-2庫...