AI項(xiàng)目和框架

Chat2SVG

Chat2SVG 是創(chuàng)新的文本到矢量圖形(SVG)生成框架,通過(guò)結(jié)合大型語(yǔ)言模型(LLMs)和圖像擴(kuò)散模型,實(shí)現(xiàn)高質(zhì)量 SVG 圖形的自動(dòng)化創(chuàng)作。通過(guò)多階段流程,首先基...
閱讀原文

QwQ-32B

QwQ-32B 是阿里巴巴開源的新型推理模型,參數(shù)量為 320 億。基于大規(guī)模強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練,在數(shù)學(xué)推理、編程等任務(wù)上表現(xiàn)出色,性能比肩 6710 億參數(shù)的 DeepS...
閱讀原文

Light-R1

Light-R1是360智腦開源的AI模型,專注于數(shù)學(xué)領(lǐng)域的長(zhǎng)思維鏈推理,具體為 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7萬(wàn)條數(shù)學(xué)數(shù)據(jù)和兩階段課程學(xué)習(xí)(SF...
閱讀原文

SpatialVLA

SpatialVLA 是上海 AI Lab、中國(guó)電信人工智能研究院和上海科技大學(xué)等機(jī)構(gòu)共同推出的新型空間具身通用操作模型,基于百萬(wàn)真實(shí)數(shù)據(jù)預(yù)訓(xùn)練,為機(jī)器人賦予通用的3...
閱讀原文

TheoremExplainAgent

TheoremExplainAgent(TEA)是滑鐵盧大學(xué)、Votee AI等機(jī)構(gòu)開源的多模態(tài)代理系統(tǒng),基于生成長(zhǎng)篇?jiǎng)赢嬕曨l幫助人們更好地理解數(shù)學(xué)和科學(xué)定理。TheoremExplainAge...
閱讀原文

Aya Vision

Aya Vision 是 Cohere 推出的多模態(tài)、多語(yǔ)言的視覺模型,提升全球范圍內(nèi)的多語(yǔ)言和多模態(tài)通信能力。支持 23 種語(yǔ)言,能執(zhí)行圖像描述生成、視覺問(wèn)答、文本翻譯...
閱讀原文

BGE-VL

BGE-VL 是北京智源研究院聯(lián)合多所高校推出的多模態(tài)向量模型,基于大規(guī)模合成數(shù)據(jù) MegaPairs 訓(xùn)練而成。BGE-VL專注于多模態(tài)檢索任務(wù),如圖文檢索和組合圖像檢...
閱讀原文

混元圖生視頻

混元圖生視頻是騰訊混元推出的開源圖生視頻模型,用戶可以通過(guò)上傳一張圖片進(jìn)行簡(jiǎn)短描述,讓圖片動(dòng)起來(lái)生成5秒的短視頻。模型支持對(duì)口型、動(dòng)作驅(qū)動(dòng)和背景音效...
閱讀原文

Granite 3.2

Granite 3.2 是IBM開源的多模態(tài)AI模型系列,具備強(qiáng)大的推理、視覺理解和預(yù)測(cè)能力。Granite 3.2包含多個(gè)版本, Granite 3.2 Instruct 提供實(shí)驗(yàn)性鏈?zhǔn)酵评砟芰?..
閱讀原文

Image-01

Image-01 是 MiniMax 推出的先進(jìn)文本到圖像生成模型,具備卓越的圖像生成能力。能將用戶輸入的文本描述精準(zhǔn)轉(zhuǎn)化為高質(zhì)量圖像,支持多種縱橫比和高分辨率輸出...
閱讀原文

PRefLexOR

PRefLexOR(Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning)是MIT團(tuán)隊(duì)提出的新型自學(xué)習(xí)AI框架,結(jié)合了偏好優(yōu)化...
閱讀原文

Probly

Probly 是 AI 驅(qū)動(dòng)的電子表格工具,結(jié)合電子表格功能與 Python 數(shù)據(jù)分析能力。Probly基于 WebAssembly 在瀏覽器中運(yùn)行 Python 代碼,支持交互式電子表格、數(shù)...
閱讀原文

MindLLM

MindLLM 是耶魯大學(xué)、達(dá)特茅斯學(xué)院和劍橋大學(xué)聯(lián)合推出的AI模型,能將腦部功能性磁共振成像(fMRI)信號(hào)解碼為自然語(yǔ)言文本。MindLLM基于一個(gè)主體無(wú)關(guān)(subjec...
閱讀原文

MiniMind

MiniMind 是開源的超小型語(yǔ)言模型項(xiàng)目,極低成本幫助個(gè)人開發(fā)者從零開始訓(xùn)練自己的語(yǔ)言模型。MiniMind 基于輕量級(jí)設(shè)計(jì),最小版本僅需25.8M參數(shù),體積僅為GPT-...
閱讀原文

Fractal Generative Models

Fractal Generative Models(分形生成模型)是麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室和Google DeepMind團(tuán)隊(duì)推出的新型圖像生成方法。Fractal Generative Mo...
閱讀原文
15556575859146