標(biāo)簽:文本生成
TinyR1-Preview
TinyR1-Preview是北京大學(xué)計(jì)算機(jī)學(xué)院與360公司聯(lián)合推出的32B參數(shù)量的推理模型。模型僅用5%的參數(shù)量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在數(shù)學(xué)領(lǐng)域...
Moonlight-16B-A3B
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 億總參數(shù)和 30 億激活參數(shù)。模型使用了優(yōu)化后的 Muon 優(yōu)化器進(jìn)行訓(xùn)練...
Mistral Saba
Mistral Saba 是法國(guó) Mistral AI 推出的專注于中東和南亞地區(qū)語(yǔ)言及文化的區(qū)域定制 AI 模型。模型擁有 240 億參數(shù),規(guī)模雖小,在處理阿拉伯語(yǔ)和印度起源語(yǔ)言...
KTransformers
KTransformers是清華大學(xué)KVCache.AI團(tuán)隊(duì)聯(lián)合趨境科技推出的開源項(xiàng)目,能優(yōu)化大語(yǔ)言模型的推理性能,降低硬件門檻。KTransformers基于GPU/CPU異構(gòu)計(jì)算策略,用...
RWKV-7-2.9B
RWKV-7-2.9B模型(RWKV-7-World-2.9B-V3) 是RWKV 基金推出的先進(jìn) RNN 大語(yǔ)言模型。基于 RWKV World V3 數(shù)據(jù)集訓(xùn)練,具有 29 億參數(shù),支持世界所有語(yǔ)言。模型...
ChatGPT Tasks
ChatGPT Tasks是OpenAI推出的新功能,屬于OpenAI Agent的初步形態(tài)。ChatGPT Tasks賦予ChatGPT執(zhí)行力,用戶能在ChatGPT聊天界面的“4o與計(jì)劃任務(wù)”模式中,用自...
Monoxer Junior
Monoxer Junior 是面向小學(xué)新生的AI家庭學(xué)習(xí)應(yīng)用,日本公司Monoxer開發(fā)。基于AI技術(shù)根據(jù)兒童的學(xué)習(xí)水平和記憶狀態(tài)智能出題,提供假名、漢字等豐富學(xué)習(xí)內(nèi)容,...
Emotion-LLaMA
Emotion-LLaMA是多模態(tài)情緒識(shí)別與推理模型,融合了音頻、視覺和文本輸入,通過(guò)特定情緒編碼器整合信息。模型基于修改版LLaMA,經(jīng)指令調(diào)整以提升情感識(shí)別能力...
粵公網(wǎng)安備 44011502001135號(hào)