AI項目和框架

清華和騰訊共同推出的圖像序列著色模型

ColorFlow是清華大學和騰訊ARC實驗室共同推出的圖像序列著色模型，能精細化地保持圖像序列中個體身份的同時進行著色。基于檢索增強、上下文學習和超分辨率技...

閱讀原文

AI工具

11個月前

AI工作流可視化構建器，拖放節點設計復雜工作流

NodeTool是開源的AI工作流可視化構建器。NodeTool集成廣泛的AI工具和模型，基于簡單、可視化的界面，讓用戶無需編碼即可快速原型設計和測試。NodeTool支持在...

閱讀原文

AI工具

11個月前

中科院聯合多所高校機構推出增強多模態音樂生成的框架

VMB（Visuals Music Bridge）是中國科學院信息工程研究所、中國科學院大學網絡空間安全學院、上海人工智能實驗室、上海交通大學等機構推出的多模態音樂生成框...

閱讀原文

AI工具

11個月前

微軟聯合清華推出的多模態生成模型

LatentLM是微軟研究院和清華大學共同推出的多模態生成模型，能統一處理離散數據（如文本）和連續數據（如圖像、音頻）。模型用變分自編碼器（VAE）將連續數據...

閱讀原文

AI工具

11個月前

Lyra：提升多模態交互體驗的SmartMore創新解決方案

Lyra是香港中文大學、SmartMore和香港科技大學推出的高效多模態大型語言模型（MLLM），專注于提升語音、視覺和語言模態的交互能力。Lyra基于開源大型模型、多...

閱讀原文

AI工具

11個月前

圖森未來推出的圖生視頻大模型

Ruyi是圖森未來科技有限公司推出的圖生視頻大模型，專為在消費級顯卡上運行設計，支持多分辨率、多時長視頻生成，具備首幀、首尾幀控制、運動幅度控制和鏡頭...

閱讀原文

AI工具

11個月前

Large Action Models：微軟行動大模型開發框架助力高效智能應用構建與部署

Large Action Models（LAMs）是微軟推出大型行動模型的開發框架，能執行真實世界行動的智能系統，LAMs超越傳統LLMs（Large Language Models，大型語言模型）...

閱讀原文

AI工具

11個月前

Meta 開源的圖像生成框架，精確控制人物的外觀和姿勢

Leffa（Learning Flow Fields in Attention）是 Meta AI推出的用在可控人物圖像生成框架，基于在注意力機制中引入流場學習，精確控制人物的外觀和姿勢。Leffa...

閱讀原文

AI工具

11個月前

Apollo：Meta與斯坦福大學攜手推出創新多模態模型，實現圖像與文本的深度融合與理解

Apollo是Meta和斯坦福大學合作推出的大型多模態模型（LMMs），專注于視頻理解。Apollo基于系統研究，揭示視頻理解在LMMs中的關鍵驅動因素，推出“Scaling Cons...

閱讀原文

AI工具

11個月前

BrushEdit：智能指令驅動的圖像編輯與修復框架全面提升創作效率與質量

BrushEdit是騰訊和北京大學等機構聯合推出的先進圖像編輯框架，是BrushNet模型的高級迭代版本。框架結合多模態大型語言模型（MLLMs）和雙分支圖像修復模型，...

閱讀原文

AI工具

11個月前

博查推出的語義排序模型

Bocha Semantic Reranker是博查AI推出的語義排序模型，能提升搜索應用和RAG應用中的搜索結果準確性。Bocha Semantic Reranker模型基于文本語義，對初步排序的...

閱讀原文

AI工具

11個月前

Veo 2：高分辨率4K視頻生成的先進AI模型，助力創意無限

Veo 2 是 Google DeepMind 推出的 AI 視頻生成模型，能根據文本或圖像提示生成高質量視頻內容。Veo 2支持高達 4K 分辨率的視頻制作，理解鏡頭控制指令，能模...

閱讀原文

AI工具

11個月前

清華開源的雙臂機器人擴散基礎模型

RDT（Robotics Diffusion Transformer）是清華大學AI研究院TSAIL團隊推出的全球最大的雙臂機器人操作任務擴散基礎模型。RDT具備十億參數量，能在無需人類操控...

閱讀原文

AI工具

11個月前

阿里開源的語音生成大模型

CosyVoice 2.0 是阿里巴巴通義實驗室推出的CosyVoice語音生成大模型升級版，模型用有限標量量化技術提高碼本利用率，簡化文本-語音語言模型架構，推出塊感知...

閱讀原文

AI工具

11個月前

無問芯穹開源的端側全模態理解模型

Megrez-3B-Omni是無問芯穹推出的全球首個端側全模態理解開源模型，能處理圖像、音頻和文本三種模態數據。Megrez-3B-Omni在多個主流測試集上展現出超越34B模型...

閱讀原文

AI工具

11個月前

1…95 969798 99…156