AI項(xiàng)目和框架

MCP Server Chart

MCP Server Chart 是螞蟻AntV團(tuán)隊(duì)推出的可視化圖表生成工具。工具基于Model Context Protocol(MCP)協(xié)議,支持超過(guò)25種可視化圖表,包括常見(jiàn)的統(tǒng)計(jì)圖表(如...
閱讀原文

Qwen VLo

Qwen VLo 是通義千問(wèn)團(tuán)隊(duì)推出的多模態(tài)統(tǒng)一理解與生成模型。在多模態(tài)大模型的基礎(chǔ)上進(jìn)行了全面升級(jí),能“看懂”世界,能基于理解進(jìn)行高質(zhì)量的再創(chuàng)造,實(shí)現(xiàn)了從感...
閱讀原文

FilMaster

FilMaster 是香港大學(xué)、快手科技、微軟研究院和清華大學(xué)聯(lián)合推出的AI電影制作系統(tǒng),將電影制作原則與生成式人工智能相結(jié)合,實(shí)現(xiàn)從劇本到最終影片的全自動(dòng)制...
閱讀原文

MultiAgentPPT

MultiAgentPPT 是多智能體演示文稿生成系統(tǒng),基于 A2A(Ask-to-Answer)、MCP(Multi-agent Control Protocol)和 ADK(Agent Development Kit)架構(gòu)。MultiA...
閱讀原文

混元-A13B

混元-A13B是騰訊最新推出的開(kāi)源大語(yǔ)言模型,基于專家混合(MoE)架構(gòu),總參數(shù)量達(dá)800億,激活參數(shù)為130億。具備輕量級(jí)設(shè)計(jì)和高效推理能力,僅需1張中低端GPU...
閱讀原文

Kling-Foley

Kling-Foley 是可靈 AI 推出的多模態(tài)視頻生音效模型。模型將視頻和文本提示作為條件輸入,能生成與視頻內(nèi)容語(yǔ)義相關(guān)、時(shí)間同步的高質(zhì)量立體聲音頻,涵蓋音效...
閱讀原文

4D-LRM

4D-LRM(Large Space-Time Reconstruction Model)是Adobe研究公司、密歇根大學(xué)等機(jī)構(gòu)的研究人員共同推出的新型4D重建模型。模型能基于稀疏的輸入視圖和任意...
閱讀原文

VLN-R1

VLN-R1是香港大學(xué)和上海人工智能實(shí)驗(yàn)室聯(lián)合推出的全新具身智能框架,基于大型視覺(jué)語(yǔ)言模型(LVLM)直接將第一人稱視頻流轉(zhuǎn)換為連續(xù)的導(dǎo)航動(dòng)作。框架基于Habit...
閱讀原文

Nanonets-OCR-s

Nanonets-OCR-s(Nanonets OCR Small)是Nanonets推出的圖像到 Markdown 的 OCR 模型,支持將圖像中的文檔內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化的 Markdown 格式。模型能提取文本...
閱讀原文

Kwai Keye-VL

Kwai Keye-VL 是快手自主研發(fā)的多模態(tài)大語(yǔ)言模型,基于 Qwen3-8B 語(yǔ)言模型整合SigLIP初始化的視覺(jué)編碼器,支持動(dòng)態(tài)分辨率輸入。模型能深度融合和處理文本、圖...
閱讀原文

Gemini CLI

Gemini CLI 是谷歌開(kāi)源的 AI Agent,將 Gemini 大模型融入開(kāi)發(fā)者終端。Gemini CLI提供強(qiáng)大 AI 功能,如代碼理解、文件操作、命令執(zhí)行及動(dòng)態(tài)排查問(wèn)題,助力開(kāi)...
閱讀原文

AlphaGenome

AlphaGenome是谷歌DeepMind推出的全新AI模型,能更深入地理解基因組。模型能接收長(zhǎng)達(dá)100萬(wàn)個(gè)堿基對(duì)的DNA序列輸入,預(yù)測(cè)數(shù)千種表征其調(diào)控活性的分子特性,評(píng)估...
閱讀原文

Claudia

Claudia 是為 Claude Code 設(shè)計(jì)的桌面應(yīng)用程序和工具包,通過(guò)直觀的圖形界面提升 AI 輔助開(kāi)發(fā)的效率和安全性。支持項(xiàng)目與會(huì)話管理,用戶可以輕松瀏覽、恢復(fù)過(guò)...
閱讀原文

DRA-Ctrl

DRA-Ctrl(Dimension-Reduction Attack)是浙江大學(xué)聯(lián)合螞蟻集團(tuán)等機(jī)構(gòu)推出的創(chuàng)新跨模態(tài)圖片編輯框架。框架借助視頻生成模型的視覺(jué)、時(shí)間、空間和因果等多維...
閱讀原文

DAMO GRAPE

DAMO GRAPE是浙江省腫瘤醫(yī)院與阿里巴巴達(dá)摩院聯(lián)合推出的全球首個(gè)基于平掃CT識(shí)別早期胃癌的AI模型。DAMO GRAPE突破傳統(tǒng)影像學(xué)限制,基于深度學(xué)習(xí)分析非增強(qiáng)CT...
閱讀原文
12627282930155