標(biāo)簽:實(shí)時(shí)監(jiān)控

CountAnything:自動(dòng)識(shí)別并統(tǒng)計(jì)相同物品數(shù)量的圖像處理應(yīng)用

CountAnything是先進(jìn)的計(jì)數(shù)應(yīng)用,基于計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)快速、準(zhǔn)確的物品自動(dòng)計(jì)數(shù)。用戶只需拍照或上傳圖片,標(biāo)記一個(gè)樣本,應(yīng)用自動(dòng)檢測并計(jì)數(shù),適用于工業(yè)...
閱讀原文

Ideogram

Ideogram是一個(gè)免費(fèi)好用的文本到圖像生成的AI工具,由來自谷歌的Google Brain和Imagen團(tuán)隊(duì)成員推出,可以幫助設(shè)計(jì)師、藝術(shù)家和AI愛好者讓創(chuàng)意表達(dá)和圖像生成...
閱讀原文

InstantID

InstantID是一種基于擴(kuò)散模型的圖像生成技術(shù),它專注于實(shí)現(xiàn)零次(zero-shot)身份保留(Identity-Preserving)的個(gè)性化圖像合成。這項(xiàng)技術(shù)允許用戶僅使用一張...
閱讀原文

Lepton Search

Lepton Search是由原阿里巴巴技術(shù)副總裁和AI科學(xué)家賈揚(yáng)清創(chuàng)辦的Lepton AI應(yīng)用構(gòu)建平臺(tái)開源的一個(gè)對話式AI搜素引擎,該項(xiàng)目基于調(diào)用Lepton平臺(tái)上的云端人工智...
閱讀原文

UniBench

UniBench是Meta FAIR機(jī)構(gòu)推出的視覺語言模型(VLM)評估框架,對視覺語言模型(VLM)進(jìn)行全面評估。UniBench包含50多個(gè)基準(zhǔn)測試,涵蓋物體識(shí)別、空間理解、推理等...
閱讀原文

ReHiFace-S

RReHiFace-S是由硅基智能團(tuán)隊(duì)推出的開源項(xiàng)目,實(shí)現(xiàn)高保真、實(shí)時(shí)人臉替換的AI算法,用戶通過簡單的操作在視頻或直播中進(jìn)行面部交換。
閱讀原文

Saner.AI

Saner.AI 是一款專為提高個(gè)人和團(tuán)隊(duì)生產(chǎn)力而設(shè)計(jì)的人工智能知識(shí)管理工具。通過簡潔直觀的界面和強(qiáng)大的AI助手,幫助用戶捕捉靈感、整理信息并生成創(chuàng)意。核心功...
閱讀原文

GarDiff

GarDiff是一種創(chuàng)新的虛擬試穿技術(shù),通過使用CLIP和VAE編碼來提取服裝的外觀先驗(yàn),結(jié)合服裝聚焦適配器和高頻細(xì)節(jié)增強(qiáng)算法,生成高保真且細(xì)節(jié)豐富的試穿圖像。...
閱讀原文

FLUX1.1

FLUX1.1 Pro是Black Forest Labs團(tuán)隊(duì)最新推出的升級版AI圖像生成模型,代號(hào)“藍(lán)莓”,提供比前代快6倍的生成速度,同時(shí)保持了圖像的及時(shí)性和多樣性。FLUX1.1目...
閱讀原文

scade.pro

scade.pro 是一個(gè)無代碼AI集成平臺(tái),集成上千種AI模型,用戶能像搭積木一樣輕松組合模型。平臺(tái)提供簡單的界面和豐富的模板,讓沒有編碼經(jīng)驗(yàn)的用戶快速構(gòu)建和...
閱讀原文

VideoAgent

VideoAgent是一種自改進(jìn)的視頻生成系統(tǒng),由斯坦福大學(xué)、滑鐵盧大學(xué)、DeepMind等機(jī)構(gòu)的研究人員共同推出。根據(jù)圖像觀察和語言指令生成視頻計(jì)劃,轉(zhuǎn)換為機(jī)器人...
閱讀原文

Glarity

Glarity是一款基于ChatGPT技術(shù)的瀏覽器擴(kuò)展工具,它能夠?yàn)閅ouTube視頻和Google搜索結(jié)果等網(wǎng)頁內(nèi)容提供自動(dòng)摘要和多語言翻譯。這款工具支持多種網(wǎng)站,包括新聞...
閱讀原文

Flux.1 Lite

Flux.1 Lite是Freepik團(tuán)隊(duì)推出的輕量級AI模型,目前處于alpha版本。Flux.1 Lite是基于80億參數(shù)的transformer架構(gòu),從FLUX.1-dev模型中提取而來。Flux.1 Lite...
閱讀原文

Phidata

Phidata是開源的AI智能體框架,幫助開發(fā)者構(gòu)建具有記憶、知識(shí)、工具和推理能力的智能代理系統(tǒng)。支持創(chuàng)建能夠協(xié)同工作的代理團(tuán)隊(duì),提供用戶界面實(shí)現(xiàn)與代理的交...
閱讀原文

FakeShield

FakeShield是北京大學(xué)研究人員推出的多模態(tài)大型語言模型框架,能檢測和定位圖像偽造。框架能評估圖像的真實(shí)性,生成被篡改區(qū)域的掩碼,提供基于像素級和圖像...
閱讀原文
1234