標(biāo)簽:圖像識(shí)別

VITRON

VITRON是Skywork AI、新加坡國(guó)立大學(xué)和南洋理工大學(xué)聯(lián)合推出的像素級(jí)視覺大型語言模型(LLM),能全面理解和處理靜態(tài)圖像與動(dòng)態(tài)視頻,對(duì)圖像和視頻進(jìn)行理解、...
閱讀原文

Tempo Labs

Tempo Labs是AI驅(qū)動(dòng)的平臺(tái),能幫助設(shè)計(jì)師和開發(fā)者基于單一真實(shí)來源進(jìn)行協(xié)作,加速React應(yīng)用的開發(fā)。Tempo Labs提供拖放式編輯器進(jìn)行代碼設(shè)計(jì),支持視覺編輯組...
閱讀原文

MolyPix.AI

Molypix.AI是AI驅(qū)動(dòng)的在線圖形設(shè)計(jì)平臺(tái),支持用戶通過簡(jiǎn)單的文字提示快速生成專業(yè)級(jí)別的視覺內(nèi)容。平臺(tái)提供豐富的模板,包括海報(bào)、邀請(qǐng)函、明信片等,讓設(shè)計(jì)...
閱讀原文

Vision Parse

Vision Parse是開源的PDF文檔轉(zhuǎn)換工具,基于視覺語言模型(Vision LLMs)將PDF文件轉(zhuǎn)換成Markdown格式。Vision Parse能智能識(shí)別和提取PDF中的文本和表格,且...
閱讀原文

Lookie

Lookie是AI穿搭應(yīng)用,支持用戶上傳照片創(chuàng)建數(shù)字分身,試穿各種潮流服飾,并提供穿搭建議。Lookie擁有近30種風(fēng)格的服飾庫,覆蓋實(shí)用穿搭、職場(chǎng)、生活、約會(huì)等...
閱讀原文

Emoji AI:個(gè)性化AI表情包生成器,讓你的情感隨時(shí)隨地生動(dòng)表達(dá)

Emoji AI是AI驅(qū)動(dòng)的表情包制作應(yīng)用,主打卡通風(fēng)格,提供搜索和文生圖功能,讓用戶能快速創(chuàng)建個(gè)性化表情。Emoji AI特別推出節(jié)日主題表情,適應(yīng)不同文化和節(jié)日...
閱讀原文

什么是狹義人工智能(Artificial Narrow Intelligence, ANI):智能家居助理提升生活便利性與舒適度

狹義人工智能(Artificial Narrow Intelligence, ANI)也被稱為“弱人工智能”,是指被設(shè)計(jì)和訓(xùn)練來執(zhí)行特定任務(wù)或狹窄范圍內(nèi)任務(wù)的人工智能系統(tǒng)。與擁有類似人...
閱讀原文

圖趣AI:多風(fēng)格AI繪畫應(yīng)用助你輕松創(chuàng)作獨(dú)特視覺藝術(shù)

圖趣AI是基于AI技術(shù)的繪畫軟件,能根據(jù)用戶的文字描述,創(chuàng)作出各種風(fēng)格和主題的藝術(shù)畫作。用戶只需輸入創(chuàng)意靈感,AI能模擬出相應(yīng)的視覺內(nèi)容,包括風(fēng)景、奇幻...
閱讀原文

Qwen2vl-Flux:多模態(tài)圖像生成模型賦能創(chuàng)意無限,支持多樣化生成模式

Qwen2VL-Flux是多模態(tài)圖像生成模型,結(jié)合Qwen2VL的視覺語言理解和FLUX框架,基于文本提示和圖像參考生成高質(zhì)量的圖像。模型支持多種生成模式,包括變體生成、...
閱讀原文

DINO-X:通用視覺大模型助力智能識(shí)別與分析的新時(shí)代

DINO-X是IDEA研究院推出的通用視覺大模型,具備開放世界對(duì)象檢測(cè)與理解能力。支持文本、視覺和定制提示,能識(shí)別圖像中的任何對(duì)象而無需用戶提示。基于超過1億...
閱讀原文

T-Rex Label:智能AI標(biāo)注工具簡(jiǎn)化復(fù)雜場(chǎng)景一鍵標(biāo)注過程

T-Rex Label是AI自動(dòng)標(biāo)注工具,IDEA計(jì)算機(jī)視覺團(tuán)隊(duì)基于T-Rex2模型創(chuàng)建。T-Rex Label支持一鍵標(biāo)注和零樣本檢測(cè),適用于農(nóng)業(yè)、工業(yè)、生物醫(yī)藥等多個(gè)行業(yè)。T-Rex...
閱讀原文

LLaVA-o1:開源視覺語言模型助力智能理解與生成內(nèi)容

LLaVA-o1是北京大學(xué)、清華大學(xué)、鵬城實(shí)驗(yàn)室、阿里巴巴達(dá)摩院以及理海大學(xué)(Lehigh University)組成的研究團(tuán)隊(duì)推出的開源視覺語言模型,基于Llama-3.2-Vision...
閱讀原文