標簽:圖像生成

KAT-V1

KAT-V1是快手開源的自動思考(AutoThink)大模型,包含40B和200B兩個版本。模型融合思考與非思考能力,能根據問題難度自動切換思考模式。40B版本性能逼近Deep...
閱讀原文

Mureka V7

Mureka V7是昆侖萬維推出的先進的AI音樂模型,具備強大的音樂創作能力。模型基于MusiCoT(音樂思維鏈)技術,先規劃整體音樂結構再填充細節,生成的音樂更具...
閱讀原文

Seed GR-3

Seed GR-3 是字節跳動 Seed 團隊推出的通用機器人模型,具備高泛化能力、長程任務處理能力和柔性物體操作能力。
閱讀原文

Copy2AI

Copy2AI 是 AI創作助手,幫助提升用戶的工作與創作效率。Copy2AI 包含三大核心產品,智能剪貼板,支持內容分析、翻譯和潤色;智能創作助手,提供靈感激發和文...
閱讀原文

EXAONE 4.0

EXAONE 4.0是韓國LG AI Research推出的自研混合推理大模型。模型融合通用自然語言處理和高級推理能力,支持韓語、英語和西班牙語。模型分為32B的專業版和1.2B...
閱讀原文

AppStruct

AppStruct 是無代碼應用開發平臺,幫助用戶無需編寫代碼快速構建和發布多平臺應用。通過直觀的拖拽式編輯器和豐富的組件庫,用戶能輕松搭建出移動應用、Web ...
閱讀原文

看往

看往是針對跨境電商和海外營銷的AI一站式賦能平臺。基于智能化工具,為用戶提供從圖片生成、視頻制作到多語言翻譯的全方位支持。看往支持一鍵搞定電商主圖設...
閱讀原文

MuseSteamer

MuseSteamer是百度推出的多模態AI視頻生成大模型。模型能根據輸入的圖片或文字提示,生成高質量的動態視頻,支持電影級畫質和音效一體化生成。
閱讀原文

FairyGen

FairyGen 是大灣區大學推出的動畫故事視頻生成框架,支持從單個手繪角色草圖出發,生成具有連貫敘事和一致風格的動畫故事視頻。框架借助多模態大型語言模型(...
閱讀原文

Qwen VLo

Qwen VLo 是通義千問團隊推出的多模態統一理解與生成模型。在多模態大模型的基礎上進行了全面升級,能“看懂”世界,能基于理解進行高質量的再創造,實現了從感...
閱讀原文

Doppl

Doppl是谷歌推出的實驗性應用,基于AI技術幫助用戶虛擬試穿服裝。用戶上傳全身照片后,支持將服裝照片或截圖“穿”在數字版自己身上,Doppl能將靜態圖片轉換為A...
閱讀原文

DAMO GRAPE

DAMO GRAPE是浙江省腫瘤醫院與阿里巴巴達摩院聯合推出的全球首個基于平掃CT識別早期胃癌的AI模型。DAMO GRAPE突破傳統影像學限制,基于深度學習分析非增強CT...
閱讀原文

Isgen

Isgen 是 AI 生成內容檢測工具,能精準識別包括 ChatGPT、GPT-4 等在內的多種 AI 模型所創作的文本。工具核心優勢在于高準確率(96.4%),支持超過 80 種語言...
閱讀原文

ImmerseGen

ImmerseGen是字節跳動的PICO團隊和浙江大學聯合推出的創新3D世界生成框架。框架根據用戶輸入的文字提示,基于Agent引導的資產設計和排列,生成帶有alpha紋理...
閱讀原文

CreateVision AI

CreateVision AI 是AI圖像生成平臺,平臺融合 Flux.1 Dev 和 GPT-Image-1 兩大頂級模型,為用戶提供開源與閉源技術路線的極致體驗。平臺支持用戶將創意想法瞬...
閱讀原文
123411