標簽:圖像識別

什么是神經網絡(Neural Network)

神經網絡(Neural Network)作為人工智能中的一種計算模型,是受人腦啟發的一種機器學習類型。本文介紹了其定義、工作原理、類型、優勢、局限和其應用場景。
閱讀原文

AI初創公司融資數據庫

AI工具集推出的AI初創公司融資數據庫,通過該頁面你可以獲取人工智能行業最新的融資數據和資訊,為投資者、創業者、研究人員和AI愛好者提供關于AI創業公司融...
閱讀原文

Screenshot to Code

Sscreenshot to Code是一個開源的項目,利用人工智能技術(GPT-4V 和 DALL·E 3)將用戶的屏幕截圖轉換為前端網頁代碼。項目的核心功能是自動化網頁設計的編碼...
閱讀原文

BrushNet

BrushNet是由騰訊PCG部門的ARC實驗室與香港大學的研究人員推出的一個基于擴散模型的即插即用的圖像照片修復(Inpainting)模型,通過分解的雙分支架構來有效...
閱讀原文

Butterflies AI

Butterflies AI是一個有趣的AI社交平臺,支持用戶定制具有個性和情感的AI角色,稱為"蝴蝶",AI虛擬角色能在平臺上自動發布動態和互動。
閱讀原文

Omages

Omages是一個開源的3D模型生成項目,基于圖像擴散技術將3D形狀的幾何和紋理信息編碼進64x64像素的2D圖像中,從而簡化3D建模流程。
閱讀原文

Qwen2-VL

Qwen2-VL是阿里巴巴達摩院開源的視覺多模態AI模型,具備高級圖像和視頻理解能力。Qwen2-VL支持多種語言,能處理不同分辨率和長寬比的圖片,實時分析動態視頻...
閱讀原文

什么是計算機視覺(Computer Vision)

計算機視覺(Computer Vision)是人工智能的一個關鍵分支,專注于使機器能夠像人類一樣解釋和理解視覺信息。它涉及圖像和視頻的獲取、處理、分析以及從這些數據...
閱讀原文

ImageBind

ImageBind是Meta公司推出的開源多模態AI模型,將文本、音頻、視覺、溫度和運動數據等六種不同類型的信息整合到一個統一的嵌入空間中。模型通過圖像模態作為橋...
閱讀原文

Myimg AI

Myimg AI是Deang.ltd公司開發的AI卡通化工具,能將用戶的照片快速轉化為海賊王風格的卡通畫。基于先進的人工智能技術,為用戶提供了一種簡單而有趣的方式,來...
閱讀原文

Comic Translate

Comic Translate 是一個開源的漫畫翻譯工具,由開發者 ogkalu2 推出。幫助用戶自動翻譯全球各地的漫畫,支持英語、韓語、日語、法語、簡體中文、繁體中文、俄...
閱讀原文

GroundingBooth

GroundingBooth 是一個先進的文本到圖像定制框架,由華盛頓大學圣路易斯分校、Adobe和普渡大學的研究團隊共同推出。基于文本-圖像對齊模塊和遮罩交叉注意力層...
閱讀原文

商湯小浣熊

商湯小浣熊是商湯科技推出的“小浣熊”系列AI智能助手,已為數十萬用戶提供了數十億次智能輔助服務,其中包括代碼小浣熊和辦公小浣熊,分別助力開發者輕松駕馭...
閱讀原文

TinyVLA

TinyVLA是一種面向機器人操控的視覺-語言-動作(VLA)模型,由華東師范大學和上海大學團隊推出。針對現有VLA模型的不足,如推理速度慢和需要大量數據預訓練,...
閱讀原文

Nanonets

Nanonets是一個無代碼AI工作流自動化平臺,專注于從文檔、郵件和數據庫中提取可操作的信息,以提高企業效率?;谙冗M的OCR、機器學習和NLP技術自動化處理發...
閱讀原文