標(biāo)簽:多模態(tài)理解

盤古大模型 5.5

盤古大模型5.5是華為在開發(fā)者大會(HDC 2025)上發(fā)布的最新一代人工智能大模型。模型強調(diào)“不作詩,只做事”,專注于解決實際產(chǎn)業(yè)問題,推動千行百業(yè)的智能化升...
閱讀原文

Kimi-Researcher

Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主強化學(xué)習(xí)(end-to-end agentic RL)技術(shù)訓(xùn)練的新一代 Agent 模型,專為深度研究任務(wù)而設(shè)計。能...
閱讀原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于視頻數(shù)據(jù)實現(xiàn)對物理世界的理解、預(yù)測和規(guī)劃。V-JEPA 2 用于 12 億參數(shù)的聯(lián)合嵌入預(yù)測架構(gòu)(JEPA),基于自監(jiān)督學(xué)習(xí)...
閱讀原文

SmolVLA

SmolVLA 是 Hugging Face 開源的輕量級視覺-語言-行動(VLA)模型,專為經(jīng)濟高效的機器人設(shè)計。擁有4.5億參數(shù),模型小巧,可在CPU上運行,單個消費級GPU即可...
閱讀原文

dots.llm1

dots.llm1 是小紅書 hi lab 開源的中等規(guī)模 Mixture of Experts(MoE)文本大模型,具有 1420 億參數(shù),激活參數(shù)為 140 億。模型在 11.2T 高質(zhì)量 token 數(shù)據(jù)上...
閱讀原文

MiniCPM 4.0

MiniCPM 4.0 是面壁智能推出的端側(cè)大模型。模型分為 8B 和 0.5B 兩種參數(shù)規(guī)模。8B 閃電稀疏版采用創(chuàng)新稀疏架構(gòu),能高效處理長文本任務(wù);0.5B 版本以低計算資...
閱讀原文

從容大模型

從容大模型是云從科技推出的多模態(tài)AI模型。模型在國際權(quán)威評測平臺OpenCompass的多模態(tài)榜單中以80.7分登頂,超越谷歌、OpenAI等頂尖團隊。
閱讀原文

MiMo-VL

MiMo-VL 是小米開源的多模態(tài)大模型,由視覺編碼器、跨模態(tài)投影層和語言模型構(gòu)成,視覺編碼器基于Qwen2.5-ViT,語言模型是小米自研的MiMo-7B。
閱讀原文

Gemini Diffusion

Gemini Diffusion是谷歌推出的實驗性文本擴散模型。與傳統(tǒng)自回歸模型逐詞生成文本不同,基于逐步細化噪聲生成輸出,能快速迭代糾正錯誤,讓Gemini Diffusion...
閱讀原文

DeepSeek-Prover-V2-671B

DeepSeek-Prover-V2-671B 是 DeepSeek 在 Hugging Face 開源社區(qū)推出的專注于數(shù)學(xué)推理的超大規(guī)模語言模型。模型擁有 6710 億參數(shù),是去年發(fā)布的數(shù)學(xué) AI 模型 ...
閱讀原文

DeepSeek-R1T-Chimera

DeepSeek-R1T-Chimera 是TNG科技公司推出的開源語言模型。結(jié)合 DeepSeek V3-0324 和DeepSeek R1兩種模型的優(yōu)勢,基于創(chuàng)新的構(gòu)建方法,將兩者的神經(jīng)網(wǎng)絡(luò)組件融...
閱讀原文

ICRA 2025|清華x光輪:自駕世界模型生成和理解事故場景

可以描述事故發(fā)生過程并提供預(yù)防建議
閱讀原文

SignLLM

SignLLM 是創(chuàng)新的多語言手語生成模型,通過文字輸入生成對應(yīng)的手語視頻。全球首個支持多國手語的模型,能覆蓋美國手語(ASL)、德國手語(GSL)、阿根廷手語...
閱讀原文

LongLLaVA:多模態(tài)上下文混合架構(gòu)大語言模型的創(chuàng)新應(yīng)用與特點解析

LongLLaVA是多模態(tài)大型語言模型(MLLM),基于混合架構(gòu)結(jié)合Mamba和Transformer模塊,能高效處理大量圖像,特別擅長視頻理解和高分辨率圖像分析。LongLLaVA在...
閱讀原文

Imagen 3

Imagen 3是Google推出的AI圖像生成模型,可以生成高質(zhì)量、逼真的圖像。Imagen 3對提示詞理解更好,可捕捉更多細節(jié),生成更廣泛的視覺風(fēng)格。基于谷歌的文生圖...
閱讀原文
123