標(biāo)簽:大模型訓(xùn)練
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會,然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...
標(biāo)點(diǎn)符號成大模型訓(xùn)練神器!KV緩存狂減一半,可處理400萬Tokens長序列,來自華為港大等 | 開源
適配各種backbone模型架構(gòu)和各種大小
代碼論文全開源!月之暗面發(fā)布重磅技術(shù)報(bào)告:模型訓(xùn)練效率翻倍
原標(biāo)題:代碼論文全開源!月之暗面發(fā)布重磅技術(shù)報(bào)告:模型訓(xùn)練效率翻倍 文章來源:人工智能學(xué)家 內(nèi)容字?jǐn)?shù):9145字AI寒武紀(jì)月之暗面團(tuán)隊(duì):Muon 優(yōu)化器與 Moonl...
DeepSeek發(fā)布NSA:超快速長上下文訓(xùn)練與推理的新突破
原標(biāo)題:DeepSeek發(fā)布NSA:超快速長上下文訓(xùn)練與推理的新突破 文章來源:小夏聊AIGC 內(nèi)容字?jǐn)?shù):3860字DeepSeek's NSA: A Breakthrough in Accelerating AI Mo...
廈門大學(xué)《大模型概念、技術(shù)與應(yīng)用實(shí)踐》(PPT文件)
《大模型概念、技術(shù)與應(yīng)用實(shí)踐》由廈門大學(xué)大數(shù)據(jù)教學(xué)團(tuán)隊(duì)制作,科普大模型技術(shù)及其在各領(lǐng)域的應(yīng)用。強(qiáng)調(diào)其在大數(shù)據(jù)教學(xué)領(lǐng)域的影響力。回顧人工智能發(fā)展簡史...
張俊林從Deepseek R1看Scaling Law的未來
原標(biāo)題:張俊林從Deepseek R1看Scaling Law的未來 文章來源:人工智能學(xué)家 內(nèi)容字?jǐn)?shù):16988字大模型Scaling Law與S型智能增長曲線:一個思想實(shí)驗(yàn) 本文探討了...