標簽:參數
一條磁力鏈接席卷AI圈,87GB種子直接開源8x7B MoE模型
機器之心報道機器之心編輯部「高端」的開源,往往采用最樸素的發布方式。昨天,Mistral AI 在 X 平臺甩出一條磁力鏈接,宣布了新的開源動作。沒有長篇官方博...
大道至簡?ETH研究團隊提出簡化版Transformer模型,綜合效率明顯提升
大數據文摘受權轉載自將門創投?2023年,Transformer已經成為人工智能領域中最受歡迎的基礎模型,如今火熱的大型語言模型,多模態大模型均由不同類型的Transfo...
H100最強競品正式發布!推理快1.6倍,內存高達192GB,來自AMD
豐色 發自 凹非寺量子位 | 公眾號 QbitAI這一夜,AI科技圈熱鬧非凡:谷歌搬出“蓄謀已久”的大殺器Gemini,號稱直接掀翻GPT-4;另一邊,芯片商AMD也按耐不住,...
秒殺700億Llama 2!最新國產大模型亮相,無需申請即可免費商用,背后公司來自私募巨頭
豐色 發自 凹非寺量子位 | 公眾號QbitAI國產大模型剛剛出了一位全新選手:參數670億的DeepSeek。它在近20個中英文的公開評測榜單上直接超越了同量級、700億的...
不是大模型全局微調不起,只是LoRA更有性價比,教程已經準備好了
選自 Sebastian Raschka 博客機器之心編譯編輯:佳琪這是作者 Sebastian Raschka 經過數百次實驗得出的經驗,值得一讀。增加數據量和模型的參數量是公認的提...
手機上0.2秒出圖、當前速度之最,谷歌打造超快擴散模型MobileDiffusion
機器之心專欄機器之心編輯部在手機等移動端側運行 Stable Diffusion 等文生圖生成式 AI 大模型已經成為業界追逐的熱點之一,其中生成速度是主要的制約因素。...
通義千問爆甩開源全家桶!最強720億參數超車Llama 2,新上視覺模型看圖直出代碼
新智元報道編輯:編輯部【新智元導讀】通義千問開源全家桶正式上線!業界最強72B模型直接超越開源標桿Llama 2-70B,還有1.8B模型、音頻大模型全部開源,阿里...
最新千億大模型免費商用:1026億參數,無需授權!誠邀開發者共同訓練
明敏 金磊 發自 凹非寺量子位 | 公眾號 QbitAI開源大模型這個圈子,真是卷到不行——國內最新紀錄來了,直奔千億量級,達到1026億。千億參數、全面開源、無需授...
首個全面開源的千億模型來了!源2.0全家桶擊破算力限制,代碼數學強到發指
新智元報道編輯:編輯部【新智元導讀】昨天,浪潮信息發布源2.0基礎大模型,并一口氣開源了1026億、518億、21億三個大模型!而在編程、推理、邏輯這些老大難...
OpenAI文件驚人曝出,Q*疑能加密!AI背著人類在編程,網友:三個月接近AGI
新智元報道編輯:Aeneas alan【新智元導讀】OpenAI員工曾在Altman被解雇的前一天發帖:AI正在自己編程!這一帖子被挖出后,更多內幕文件被曝出,表示Q*已經破...
簡化版Transformer來了,網友:年度論文
機器之心報道機器之心編輯部從大模型的根源開始優化。Transformer 架構可以說是近期深度學習領域許多成功案例背后的主力軍。構建深度 Transformer 架構的一種...
李沐大模型公司細節曝光,項目GitHub空倉標星超500
衡宇 發自 凹非寺量子位 | 公眾號 QbitAIAI大神李沐大模型創業方向,終于“水落石出”:利用大模型能力,做游戲引擎,且是面向4A游戲。關于4A游戲這個概念,目...
清華提出 SoRA,參數量只有 LoRA 的 70%,表現更好!
夕小瑤科技說 原創作者 | 智商掉了一地、Python現在有很多關于大型語言模型(LLM)的研究,都圍繞著如何高效微調展開。微調是利用模型在大規模通用數據上學到...
OpenAI內斗時,Karpathy在錄視頻:《大型語言模型入門》上線
機器之心報道編輯:杜偉趕緊學習起來吧!OpenAI 的風波暫時告一段落,員工也忙著「干活了」。年初回歸 OpenAI 的 Andrej Karpathy 最近做了一場關于大型語言...
粵公網安備 44011502001135號