標簽:模型壓縮

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Pocket Flow

Pocket Flow 是極簡的 LLM(大型語言模型)框架,僅用 100 行代碼實現,具有輕量級、無依賴、無廠商鎖定的特點。Pocket Flow支持多Agents、工作流、檢索增強...
閱讀原文

何愷明ResNet級神作,分形生成模型計算效率狂飆4000倍!清華校友一作

原標題:何愷明ResNet級神作,分形生成模型計算效率狂飆4000倍!清華校友一作 文章來源:新智元 內容字數:10734字何愷明團隊提出分形生成模型:AI圖像生成新...
閱讀原文

稀疏注意力再添一員,華為諾亞推出高效選擇注意力架構ESA

為大模型在長序列任務中的應用帶來了新的可能性。
閱讀原文

4000字!深度解析 DeepSeek 的蒸餾技術

深入剖析DeepSeek蒸餾技術的核心原理、創新策略以及未來發展方向
閱讀原文

吳恩達力挺DeepSeek:開源降本30倍,AI格局生變

原標題:吳恩達力挺DeepSeek:開源降本30倍,AI格局生變 文章來源:AI范兒 內容字數:4063字DeepSeek引發的AI領域震蕩:吳恩達解讀及行業影響 近日,中國AI...
閱讀原文

2025年大模型與Transformer架構:技術前沿與未來趨勢報告

原標題:2025年大模型與Transformer架構:技術前沿與未來趨勢報告 文章來源:人工智能學家 內容字數:24793字歐米伽未來研究所:Transformer架構的崛起與未來...
閱讀原文

從infra的視角聊聊DeepSeek-V3

從infra的視角分享一些個人看法
閱讀原文

「知識蒸餾+持續學習」最新綜述!哈工大、中科院出品:全新分類體系,十大數據集全面實驗

原標題:「知識蒸餾+持續學習」最新綜述!哈工大、中科院出品:全新分類體系,十大數據集全面實驗 文章來源:新智元 內容字數:14584字知識蒸餾在持續學習中...
閱讀原文
12