標簽：參數

一條磁力鏈接席卷AI圈，87GB種子直接開源8x7B MoE模型

機器之心報道機器之心編輯部「高端」的開源，往往采用最樸素的發布方式。昨天，Mistral AI 在 X 平臺甩出一條磁力鏈接，宣布了新的開源動作。沒有長篇官方博...

閱讀原文

AIGC動態

2年前 (2023)

大道至簡？ETH研究團隊提出簡化版Transformer模型，綜合效率明顯提升

大數據文摘受權轉載自將門創投?2023年，Transformer已經成為人工智能領域中最受歡迎的基礎模型，如今火熱的大型語言模型，多模態大模型均由不同類型的Transfo...

閱讀原文

AIGC動態

2年前 (2023)

H100最強競品正式發布！推理快1.6倍，內存高達192GB，來自AMD

豐色發自凹非寺量子位 | 公眾號 QbitAI這一夜，AI科技圈熱鬧非凡：谷歌搬出“蓄謀已久”的大殺器Gemini，號稱直接掀翻GPT-4；另一邊，芯片商AMD也按耐不住，...

閱讀原文

AIGC動態

2年前 (2023)

秒殺700億Llama 2！最新國產大模型亮相，無需申請即可免費商用，背后公司來自私募巨頭

豐色發自凹非寺量子位 | 公眾號QbitAI國產大模型剛剛出了一位全新選手：參數670億的DeepSeek。它在近20個中英文的公開評測榜單上直接超越了同量級、700億的...

閱讀原文

AIGC動態

2年前 (2023)

不是大模型全局微調不起，只是LoRA更有性價比，教程已經準備好了

選自 Sebastian Raschka 博客機器之心編譯編輯：佳琪這是作者 Sebastian Raschka 經過數百次實驗得出的經驗，值得一讀。增加數據量和模型的參數量是公認的提...

閱讀原文

AIGC動態

2年前 (2023)

手機上0.2秒出圖、當前速度之最，谷歌打造超快擴散模型MobileDiffusion

機器之心專欄機器之心編輯部在手機等移動端側運行 Stable Diffusion 等文生圖生成式 AI 大模型已經成為業界追逐的熱點之一，其中生成速度是主要的制約因素。...

閱讀原文

AIGC動態

2年前 (2023)

通義千問爆甩開源全家桶！最強720億參數超車Llama 2，新上視覺模型看圖直出代碼

新智元報道編輯：編輯部【新智元導讀】通義千問開源全家桶正式上線！業界最強72B模型直接超越開源標桿Llama 2-70B，還有1.8B模型、音頻大模型全部開源，阿里...

閱讀原文

AIGC動態

2年前 (2023)

最新千億大模型免費商用：1026億參數，無需授權！誠邀開發者共同訓練

明敏金磊發自凹非寺量子位 | 公眾號 QbitAI開源大模型這個圈子，真是卷到不行——國內最新紀錄來了，直奔千億量級，達到1026億。千億參數、全面開源、無需授...

閱讀原文

AIGC動態

2年前 (2023)

首個全面開源的千億模型來了！源2.0全家桶擊破算力限制，代碼數學強到發指

新智元報道編輯：編輯部【新智元導讀】昨天，浪潮信息發布源2.0基礎大模型，并一口氣開源了1026億、518億、21億三個大模型！而在編程、推理、邏輯這些老大難...

閱讀原文

AIGC動態

2年前 (2023)

OpenAI文件驚人曝出，Q*疑能加密！AI背著人類在編程，網友：三個月接近AGI

新智元報道編輯：Aeneas alan【新智元導讀】OpenAI員工曾在Altman被解雇的前一天發帖：AI正在自己編程！這一帖子被挖出后，更多內幕文件被曝出，表示Q*已經破...

閱讀原文

AIGC動態

2年前 (2023)

簡化版Transformer來了，網友：年度論文

機器之心報道機器之心編輯部從大模型的根源開始優化。Transformer 架構可以說是近期深度學習領域許多成功案例背后的主力軍。構建深度 Transformer 架構的一種...

閱讀原文

AIGC動態

2年前 (2023)

李沐大模型公司細節曝光，項目GitHub空倉標星超500

衡宇發自凹非寺量子位 | 公眾號 QbitAIAI大神李沐大模型創業方向，終于“水落石出”：利用大模型能力，做游戲引擎，且是面向4A游戲。關于4A游戲這個概念，目...

閱讀原文

AIGC動態

2年前 (2023)

清華提出 SoRA，參數量只有 LoRA 的 70%，表現更好！

夕小瑤科技說原創作者 | 智商掉了一地、Python現在有很多關于大型語言模型（LLM）的研究，都圍繞著如何高效微調展開。微調是利用模型在大規模通用數據上學到...

閱讀原文

AIGC動態

2年前 (2023)

OpenAI內斗時，Karpathy在錄視頻：《大型語言模型入門》上線

機器之心報道編輯：杜偉趕緊學習起來吧！OpenAI 的風波暫時告一段落，員工也忙著「干活了」。年初回歸 OpenAI 的 Andrej Karpathy 最近做了一場關于大型語言...

閱讀原文

AIGC動態

2年前 (2023)

大模型掃盲系列——初識大模型

大數據文摘受權轉載自數據派THU作者：金一鳴編輯：黃繼彥近年來，隨著計算機技術和大數據的快速發展，深度學習在各個領域取得了顯著的成果。為了提高模型的性...

閱讀原文

AIGC動態

2年前 (2023)

1…12 131415 16