標簽:圖像識別

I2V3D

I2V3D是香港城市大學和微軟 GenAI創新的圖像到視頻生成框架,支持將靜態圖像轉換為動態視頻,基于3D幾何引導實現精確的動畫控制。I2V3D結合傳統計算機圖形學...
閱讀原文

Aya Vision

Aya Vision 是 Cohere 推出的多模態、多語言的視覺模型,提升全球范圍內的多語言和多模態通信能力。支持 23 種語言,能執行圖像描述生成、視覺問答、文本翻譯...
閱讀原文

PixVerse V4

PixVerse V4 是愛詩科技推出的最新 AI 視頻生成工具,基于文本或圖片輸入快速生成高質量的 AI 視頻,生成速度最快可達 5 秒。新版本在語義理解、物理規律表現...
閱讀原文

Microsoft Research Forum

Microsoft Research Forum 是微軟研究院推出的系列虛擬論壇活動,匯聚全球科技與研究領域的專家學者,共同探討人工智能及相關前沿技術的最新進展、創新理念與...
閱讀原文

HumanDiT

HumanDiT 是浙江大學和字節跳動聯合提出的姿態引導的高保真人體視頻生成框架。基于擴散變換器(Diffusion Transformer,DiT),能在大規模數據集上訓練,生成...
閱讀原文

LLaVA-Rad

LLaVA-Rad是微軟研究院推出的小型多模態模型,專注于臨床放射學報告生成。是LLaVA-Med項目的分支,特別是胸部X光(CXR)成像。基于LLaVA-Med的基礎架構和訓練...
閱讀原文

Lumina-Image 2.0

Lumina-Image 2.0 是開源的高效統一圖像生成模型,參數量為26億,基于擴散模型和Transformer架構。在圖像生成質量、復雜提示理解和資源效率方面表現出色,在...
閱讀原文

MimicPhoto

MimicPhoto 是 GenAI Works 推出的 AI 驅動的照片編輯工具,專注于通過智能技術提升照片中的人物面部表情和整體效果。能快速調整笑容、眼神等細節,讓照片中...
閱讀原文

北京郵電大學AI入門課《AI在大前》

親愛的同學們,你們好!在進入大學之前,這個課程將讓你對人工智能有全新的認知和理解。你將學習到人工智能的核心概念,學習數學和物理學的相關基礎知識,了解...
閱讀原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,專為需要深度、復雜研究的用戶設計。能在短時間內(5到30分鐘)完成人類專家需要數小時甚至數天才能完...
閱讀原文

明犀AI

明犀AI是AI圖像增強工具。明犀AI基于圖像生成先驗和大模型能力,實現在文本提示引導下恢復圖像的功能,能用負面提示和修復引導采樣方法提升修復質量。明犀AI...
閱讀原文

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模態圖片理解模型,模型完善了 moonshot-v1 模型系列的多模態能力,具備強大的圖像識別能力,能精準區分復雜...
閱讀原文

MultiBooth

MultiBooth是清華大學深圳國際研究生院、 Meta、香港科技大學等機構推出的多概念圖像生成方法,能從文本中生成包含多個用戶指定概念的圖像。MultiBooth將生成...
閱讀原文

R2R

R2R是先進的AI檢索系統,專注于Retrieval-Augmented Generation(增強型檢索生成)。R2R集成多模態內容攝取、混合搜索、知識圖譜構建、GraphRAG聚類分析、用...
閱讀原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律臨、百度文庫、百度教育等多個內容生態,確保搜索結果的可靠性...
閱讀原文