標簽:多模態理解
Kimi-Researcher
Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,專為深度研究任務而設計。能...
MiniCPM 4.0
MiniCPM 4.0 是面壁智能推出的端側大模型。模型分為 8B 和 0.5B 兩種參數規模。8B 閃電稀疏版采用創新稀疏架構,能高效處理長文本任務;0.5B 版本以低計算資...
Gemini Diffusion
Gemini Diffusion是谷歌推出的實驗性文本擴散模型。與傳統自回歸模型逐詞生成文本不同,基于逐步細化噪聲生成輸出,能快速迭代糾正錯誤,讓Gemini Diffusion...
DeepSeek-Prover-V2-671B
DeepSeek-Prover-V2-671B 是 DeepSeek 在 Hugging Face 開源社區推出的專注于數學推理的超大規模語言模型。模型擁有 6710 億參數,是去年發布的數學 AI 模型 ...
DeepSeek-R1T-Chimera
DeepSeek-R1T-Chimera 是TNG科技公司推出的開源語言模型。結合 DeepSeek V3-0324 和DeepSeek R1兩種模型的優勢,基于創新的構建方法,將兩者的神經網絡組件融...
粵公網安備 44011502001135號