標(biāo)簽:圖像識別
Lumina-Image 2.0
Lumina-Image 2.0 是開源的高效統(tǒng)一圖像生成模型,參數(shù)量為26億,基于擴(kuò)散模型和Transformer架構(gòu)。在圖像生成質(zhì)量、復(fù)雜提示理解和資源效率方面表現(xiàn)出色,在...
MimicPhoto
MimicPhoto 是 GenAI Works 推出的 AI 驅(qū)動的照片編輯工具,專注于通過智能技術(shù)提升照片中的人物面部表情和整體效果。能快速調(diào)整笑容、眼神等細(xì)節(jié),讓照片中...
北京郵電大學(xué)AI入門課《AI在大前》
親愛的同學(xué)們,你們好!在進(jìn)入大學(xué)之前,這個課程將讓你對人工智能有全新的認(rèn)知和理解。你將學(xué)習(xí)到人工智能的核心概念,學(xué)習(xí)數(shù)學(xué)和物理學(xué)的相關(guān)基礎(chǔ)知識,了解...
Deep Research
Deep Research是OpenAI推出的新型AI深度搜索研究工具,專為需要深度、復(fù)雜研究的用戶設(shè)計。能在短時間內(nèi)(5到30分鐘)完成人類專家需要數(shù)小時甚至數(shù)天才能完...
moonshot-v1-vision-preview
moonshot-v1-vision-preview 是月之暗面推出的多模態(tài)圖片理解模型,模型完善了 moonshot-v1 模型系列的多模態(tài)能力,具備強(qiáng)大的圖像識別能力,能精準(zhǔn)區(qū)分復(fù)雜...
MultiBooth
MultiBooth是清華大學(xué)深圳國際研究生院、 Meta、香港科技大學(xué)等機(jī)構(gòu)推出的多概念圖像生成方法,能從文本中生成包含多個用戶指定概念的圖像。MultiBooth將生成...
Tempo Labs
Tempo Labs是AI驅(qū)動的平臺,能幫助設(shè)計師和開發(fā)者基于單一真實(shí)來源進(jìn)行協(xié)作,加速React應(yīng)用的開發(fā)。Tempo Labs提供拖放式編輯器進(jìn)行代碼設(shè)計,支持視覺編輯組...
MolyPix.AI
Molypix.AI是AI驅(qū)動的在線圖形設(shè)計平臺,支持用戶通過簡單的文字提示快速生成專業(yè)級別的視覺內(nèi)容。平臺提供豐富的模板,包括海報、邀請函、明信片等,讓設(shè)計...
Vision Parse
Vision Parse是開源的PDF文檔轉(zhuǎn)換工具,基于視覺語言模型(Vision LLMs)將PDF文件轉(zhuǎn)換成Markdown格式。Vision Parse能智能識別和提取PDF中的文本和表格,且...
Emoji AI:個性化AI表情包生成器,讓你的情感隨時隨地生動表達(dá)
Emoji AI是AI驅(qū)動的表情包制作應(yīng)用,主打卡通風(fēng)格,提供搜索和文生圖功能,讓用戶能快速創(chuàng)建個性化表情。Emoji AI特別推出節(jié)日主題表情,適應(yīng)不同文化和節(jié)日...