標(biāo)簽:多模態(tài)理解
Kimi-Researcher
Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主強化學(xué)習(xí)(end-to-end agentic RL)技術(shù)訓(xùn)練的新一代 Agent 模型,專為深度研究任務(wù)而設(shè)計。能...
MiniCPM 4.0
MiniCPM 4.0 是面壁智能推出的端側(cè)大模型。模型分為 8B 和 0.5B 兩種參數(shù)規(guī)模。8B 閃電稀疏版采用創(chuàng)新稀疏架構(gòu),能高效處理長文本任務(wù);0.5B 版本以低計算資...
Gemini Diffusion
Gemini Diffusion是谷歌推出的實驗性文本擴散模型。與傳統(tǒng)自回歸模型逐詞生成文本不同,基于逐步細化噪聲生成輸出,能快速迭代糾正錯誤,讓Gemini Diffusion...
DeepSeek-Prover-V2-671B
DeepSeek-Prover-V2-671B 是 DeepSeek 在 Hugging Face 開源社區(qū)推出的專注于數(shù)學(xué)推理的超大規(guī)模語言模型。模型擁有 6710 億參數(shù),是去年發(fā)布的數(shù)學(xué) AI 模型 ...
DeepSeek-R1T-Chimera
DeepSeek-R1T-Chimera 是TNG科技公司推出的開源語言模型。結(jié)合 DeepSeek V3-0324 和DeepSeek R1兩種模型的優(yōu)勢,基于創(chuàng)新的構(gòu)建方法,將兩者的神經(jīng)網(wǎng)絡(luò)組件融...
LongLLaVA:多模態(tài)上下文混合架構(gòu)大語言模型的創(chuàng)新應(yīng)用與特點解析
LongLLaVA是多模態(tài)大型語言模型(MLLM),基于混合架構(gòu)結(jié)合Mamba和Transformer模塊,能高效處理大量圖像,特別擅長視頻理解和高分辨率圖像分析。LongLLaVA在...