標簽:圖像生成

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5(簡稱SF-LLaVA-1.5)是專為長視頻理解設計的高效視頻大語言模型。基于雙流(SlowFast)機制,平衡處理更多輸入幀與減少每幀令牌數量之間...
閱讀原文

RynnVLA-001

RynnVLA-001 是阿里達摩院推出的視覺-語言-動作模型。模型通過在大量第一人稱視角的視頻上進行預訓練,學習人類操作技能,并隱式遷移到機器人手臂的操控中。
閱讀原文

Auggie

Auggie 是Augment推出的 AI 驅動的智能命令行工具,專為開發者設計。工具能融入開發環境(如命令行、VS Code 和 JetBrains IDEs),能深度理解整個代碼庫,自...
閱讀原文

dots.vlm1

dots.vlm1 是小紅書 hi lab 開源的首個多模態大模型。基于一個從零訓練的 12 億參數視覺編碼器 NaViT 和 DeepSeek V3 大語言模型(LLM),具備強大的視覺感知...
閱讀原文

Kineto

Kineto 是 JetBrains 推出的AI無代碼平臺,基于 AI 技術幫助用戶快速創建和部署網站及 Web 應用。用戶只需用自然語言描述項目需求,Kineto 能生成完整的應用...
閱讀原文

Qwen-Image

Qwen-Image 是阿里通義千問團隊開源的 20B 參數MMDiT模型,是通義千問系列中首個圖像生成基礎模型,模型在復雜文本渲染和精確圖像編輯方面表現出色,支持多行...
閱讀原文

FLUX.1 Krea [dev]

FLUX.1 Krea [dev] 是 Black Forest Labs 與 Krea AI 合作推出的最新文本到圖像生成模型,支持生成更逼真、更多樣化的圖像,實現照片級真實感水平。
閱讀原文

Seed Diffusion

Seed Diffusion是字節跳動Seed團隊推出的實驗性擴散語言模型,專注于代碼生成任務。模型通過兩階段擴散訓練、約束順序學習和強化高效并行解碼等關鍵技術,實...
閱讀原文

Rustic AI

Rustic AI 是專注于設計領域的 AI 平臺,通過人工智能技術幫助用戶快速生成和編輯高質量的圖像。為電商賣家、創作者、營銷人員和設計師等提供了定制化的解決...
閱讀原文

Magic Patterns

Magic Patterns 是面向產品團隊的 AI 原型設計平臺,幫助團隊快速構建、測試和迭代產品原型,實現數據驅動的設計決策。通過 AI 技術,能根據用戶輸入的文本描...
閱讀原文

Jupitrr AI

Jupitrr AI 是強大的 AI 驅動的視頻編輯工具,專為內容創作者和企業設計,幫助用戶快速生成高質量的視頻內容,無需專業的視頻編輯技能。通過智能分析視頻或音...
閱讀原文

通義萬相2.2

通義萬相2.2(Wan2.2)是阿里巴巴開源的先進AI視頻生成模型。共開源文生視頻(Wan2.2-T2V-A14B)、圖生視頻(Wan2.2-I2V-A14B)和統一視頻生成(Wan2.2-IT2V-...
閱讀原文

悟能

悟能是商湯科技推出的面向機器人和智能設備的具身智能系統。平臺基于商湯的“開悟”世界模型,結合多模態大模型技術,賦予機器人強大的感知、決策和行動能力。...
閱讀原文

Memories.ai

Memories.ai 是前 Meta Reality Labs 頂尖科學家團隊創立的人工智能視頻分析平臺,專注于開發大型視覺記憶模型(LVMM)。推出世界上首個大型視覺記憶模型。模...
閱讀原文

KAT-V1

KAT-V1是快手開源的自動思考(AutoThink)大模型,包含40B和200B兩個版本。模型融合思考與非思考能力,能根據問題難度自動切換思考模式。40B版本性能逼近Deep...
閱讀原文
12311