標簽:代碼
馬斯克燒60億美元難題,國內大廠有解?開源MoE模算效率黑馬登場,3.7B參數單挑Llama 3-70B
新智元報道編輯:編輯部 【新智元導讀】馬斯克最近哭窮表示,xAI需要部署10萬個H100才能訓出Grok 3,影響全球的大模型算力荒怎么解?昨天開源的這款MoE大模型...
模塊化重構LLaVA,替換組件只需添加1-2個文件,開源TinyLLaVA Factory來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
喂飯級教程,看我如何用ChatGPT-4o做一款方塊游戲!
昨天發的一篇文章,講的是用 Midjourney 加 Kimi 做一款像素游戲。發完后,朋友看到說:“這他媽是游戲嘛,這跟你兒子學的 Scratch 做的游戲有什么區別?”我當...
HyperAI超神經 x 開源中國 | 5 月 26 日源創會·深圳站來襲,轟趴館等你
5 月 26 日,OSC 源創會 · 深圳站 來自 Gitee AI、昇思、訊飛、IDEA研究院的業界專家 探討大模型技術在終端的應用 分享編程語言對端側代碼生成實現的優化 以...
微軟深夜再掀AI生產力,奧特曼登臺「自曝」新模型!定制Copilot十億打工人狂歡
新智元報道編輯:編輯部 【新智元導讀】微軟昨夜剛上演了一波AI PC革命,今天又全是Copilot。而最讓人意外的,竟是奧特曼本人登臺預告了下一代模型將會帶來新...
70B模型秒出1000token,代碼重寫超越GPT-4o,來自OpenAI投資的代碼神器Cursor團隊
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI70B模型,秒出1000token,換算成字符接近4000! 研究人員將Llama3進行了微調并引入加速算法,和原生版本相比,速度...
?白嫖GPT4,Dalle3和GPT4V – 字節開發的Coze初體驗!附教程及提示詞Prompt
直播預告|今晚七點,「企業級大模型工程實踐在線研討會」將舉行。阿里巴巴 AI 基礎架構工程師劉彬、NVIDIA 軟件解決方案架構師吳金鐘兩位技術專家將分別主講...
無需OpenAI數據,躋身代碼大模型榜單!UIUC發布StarCoder-15B-Instruct
新智元報道編輯:LRT 【新智元導讀】通過StarCoder2-15B生成數千個指令-響應對,直接對StarCoder-15B基座模型進行微調,無需依賴昂貴的人工標注數據,也無需...
中電信AI大模型TeleChat-12B評測:使用3T tokens預訓練,已開源!
直播預告 | 5月14日晚7點,「智猩猩、AI新青年講座」第235講正式開講,慕尼黑工業大學視覺實驗室陳振宇博士將直播講解《三維室內場景紋理圖生成》歡迎掃碼報...
OpenAI神秘gpt2正在A/B測試,奧特曼搶先劇透,網友已玩嗨
明敏 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI正在秘密A/B測試下一代模型,實力超強被懷疑是GPT-4.5或GPT-5。 就在奧特曼當謎語人暗示之后,兩款新模型悄悄...
國產開源MoE指標炸裂:GPT-4級別能力,API價格僅百分之一
明敏 發自 凹非寺量子位 | 公眾號 QbitAI最新國產開源MoE大模型,剛剛亮相就火了。 DeepSeek-V2性能達GPT-4級別,但開源、可免費商用、API價格僅為GPT-4-Turb...
今日arXiv最熱大模型論文:首個面向AI的python編程框架,提升大模型編程能力新思路
夕小瑤科技說 原創作者 | 謝年年高級編程語言Python有兩個受眾:一是編譯和執行程序的機器,二是閱讀、理解和編寫程序的人類。機器關注程序的語義操作,而人...
12年前上手深度學習,Karpathy掀起一波AlexNet時代回憶殺,LeCun、Goodfellow等都下場
機器之心報道 機器之心編輯部沒想到,自 2012 年 AlexNet 開啟的深度學習革命已經過去了 12 年。 而如今,我們也進入了大模型的時代。 近日,知名 AI 研究科...
市值首次突破2萬億美元,谷歌卻反手把美國Python 團隊一鍋端了!
大數據文摘受權轉載自頭部科技 文丨Congerry 盡管市值剛剛達到新的里程碑,但是谷歌為了省錢竟然直接將整個 Python 團隊給開了! 4月27日,一則新聞在科技界...
GitHub版Devin上線,會打字就能開發應用,微軟CEO:重新定義IDE
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI微軟的“GitHub版Devin”——Copilot WorkSpace,終于上線了! WorkSpace是一種“Copilot原生”的全新開發環境,目的是讓...