91亚洲一区二区在线观看不卡,亚洲一区二区影院,午夜亚洲福利在线老司机

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經常用來日常寫作，雖然本身提供了AI功能，但可惜需要會員，本文教你三分鐘接入最火的DeepSeek，讓WPS秒變辦公神器。 DeepSeek API申請地址：http:/...

閱讀原文

AI教程

10個月前

AI賺錢副業~AI生成影視解說，半個月漲粉變現3.5W+！

這兩年大家都在感嘆生活不易，然而我想說的是，機會還是有的，但問題不在于有沒有，而在于你是否能夠認準機會，然后抓住它。接觸過很多咨詢項目的人，發現...

使用教程

1年前 (2024)

Pocket Flow

Pocket Flow 是極簡的 LLM（大型語言模型）框架，僅用 100 行代碼實現，具有輕量級、無依賴、無廠商鎖定的特點。Pocket Flow支持多Agents、工作流、檢索增強...

閱讀原文

AI工具

7個月前

360AI推出DiT架構下"省錢版"ControlNet, 參數量驟減85%性能達到SOTA！

性能超過OminiControl

閱讀原文

AIGC動態

10個月前

無需訓練讓擴散模型提速2倍，上交大提出Token級緩存方案｜ICLR‘25

OpenSora/PixArt都能提速

閱讀原文

AIGC動態

10個月前

何愷明ResNet級神作，分形生成模型計算效率狂飆4000倍！清華校友一作

原標題：何愷明ResNet級神作，分形生成模型計算效率狂飆4000倍！清華校友一作文章來源：新智元內容字數：10734字何愷明團隊提出分形生成模型：AI圖像生成新...

閱讀原文

AIGC動態

10個月前

稀疏注意力再添一員，華為諾亞推出高效選擇注意力架構ESA

為大模型在長序列任務中的應用帶來了新的可能性。

閱讀原文

AIGC動態

10個月前

開源賽道太擠了！月之暗面開源新版Muon優化器

又「撞車」了。

閱讀原文

AIGC動態

10個月前

1/30訓練步驟復刻DeepSeek-R1-Zero，沈向洋姜大昕張祥雨等開源推理模型RL訓練方法

復雜獎勵函數不是必要的

閱讀原文

AIGC動態

10個月前

比知識蒸餾好用，田淵棟等提出連續概念混合，再度革新Transformer預訓練框架

讓訓練token驟減！

閱讀原文

AIGC動態

10個月前

Sebastian Raschka：關于DeepSeek R1和推理模型，我有幾點看法

構建和優化推理模型的方法和策略。

閱讀原文

AIGC動態

10個月前

4000字！深度解析 DeepSeek 的蒸餾技術

深入剖析DeepSeek蒸餾技術的核心原理、創新策略以及未來發展方向

閱讀原文

AIGC動態

11個月前

吳恩達力挺DeepSeek：開源降本30倍，AI格局生變

原標題：吳恩達力挺DeepSeek：開源降本30倍，AI格局生變文章來源：AI范兒內容字數：4063字DeepSeek引發的AI領域震蕩：吳恩達解讀及行業影響近日，中國AI...

閱讀原文

AIGC動態

11個月前

2025年大模型與Transformer架構：技術前沿與未來趨勢報告

原標題：2025年大模型與Transformer架構：技術前沿與未來趨勢報告文章來源：人工智能學家內容字數：24793字歐米伽未來研究所：Transformer架構的崛起與未來...

閱讀原文

AIGC動態

11個月前

僅8個月就把GPT-4o帶到了端側，面壁智能拿到了什么秘籍？｜甲子光年

端側GPT-4o水平模型，成色如何？

閱讀原文

AIGC動態

11個月前

從infra的視角聊聊DeepSeek-V3

從infra的視角分享一些個人看法

閱讀原文

AIGC動態

11個月前

「知識蒸餾+持續學習」最新綜述！哈工大、中科院出品：全新分類體系，十大數據集全面實驗

原標題：「知識蒸餾+持續學習」最新綜述！哈工大、中科院出品：全新分類體系，十大數據集全面實驗文章來源：新智元內容字數：14584字知識蒸餾在持續學習中...

閱讀原文

AIGC動態

11個月前

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

標簽：模型壓縮

WPS接入DeepSeek，秒變辦公神器！

AI賺錢副業~AI生成影視解說，半個月漲粉變現3.5W+！

Pocket Flow

360AI推出DiT架構下"省錢版"ControlNet, 參數量驟減85%性能達到SOTA！

無需訓練讓擴散模型提速2倍，上交大提出Token級緩存方案｜ICLR‘25

何愷明ResNet級神作，分形生成模型計算效率狂飆4000倍！清華校友一作

稀疏注意力再添一員，華為諾亞推出高效選擇注意力架構ESA

開源賽道太擠了！月之暗面開源新版Muon優化器

1/30訓練步驟復刻DeepSeek-R1-Zero，沈向洋姜大昕張祥雨等開源推理模型RL訓練方法

比知識蒸餾好用，田淵棟等提出連續概念混合，再度革新Transformer預訓練框架

Sebastian Raschka：關于DeepSeek R1和推理模型，我有幾點看法

4000字！深度解析 DeepSeek 的蒸餾技術

吳恩達力挺DeepSeek：開源降本30倍，AI格局生變

2025年大模型與Transformer架構：技術前沿與未來趨勢報告

僅8個月就把GPT-4o帶到了端側，面壁智能拿到了什么秘籍？｜甲子光年

從infra的視角聊聊DeepSeek-V3

「知識蒸餾+持續學習」最新綜述！哈工大、中科院出品：全新分類體系，十大數據集全面實驗