標簽:內容創作

Mistral Small 3.1

Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
閱讀原文

Tanka

Tanka 是具有長期記憶功能的 AI 智能通訊工具,專為團隊協作設計。Tanka基于記憶過去的對話和業務上下文,提供智能回復、總結要點、設置提醒等服務,幫助團隊...
閱讀原文

LCVD

LCVD(Lighting Controllable Video Diffusion Model)是四川大學推出的高保真、光照可控的肖像動畫生成框架。LCVD基于分離肖像的內在特征(如身份和外觀)與...
閱讀原文

海螺視頻APP

海螺視頻APP是MiniMax推出的AI視頻生成工具,基于AI技術幫助用戶生成高質量視頻內容。海螺視頻APP支持文生視頻(T2V)和圖生視頻(I2V)功能,用戶輸入文本或...
閱讀原文

LDGen

LDGen是創新的文本到圖像合成技術,通過結合大型語言模型(LLMs)與擴散模型,提升文本描述到圖像生成的質量和語義一致性。通過分層標題優化和人類指令技術,...
閱讀原文

Moonlight-16B-A3B

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 億總參數和 30 億激活參數。模型使用了優化后的 Muon 優化器進行訓練...
閱讀原文

Mistral Saba

Mistral Saba 是法國 Mistral AI 推出的專注于中東和南亞地區語言及文化的區域定制 AI 模型。模型擁有 240 億參數,規模雖小,在處理阿拉伯語和印度起源語言...
閱讀原文

通古大模型

通古大模型是華南理工大學深度學習與視覺計算實驗室(SCUT-DLVCLab)推出的專注于古籍文言文處理的人工智能語言模型。基于百川2-7B-Base進行增量預訓練,使用...
閱讀原文

ChatGPT Tasks

ChatGPT Tasks是OpenAI推出的新功能,屬于OpenAI Agent的初步形態。ChatGPT Tasks賦予ChatGPT執行力,用戶能在ChatGPT聊天界面的“4o與計劃任務”模式中,用自...
閱讀原文

什么是視頻擴散模型(Video Diffusion Models, VDM)

視頻擴散模型(Video Diffusion Models, VDM)是一種結合了變分自編碼器(VAE)和擴散模型優勢的生成模型。VDM的核心思想是在潛在空間中進行擴散過程,而不是...
閱讀原文

OpenAI o3

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

RWKV-7

RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
閱讀原文

OpenAI o3:OpenAI推出超強推理模型,智能提升與創新思維的完美結合

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

Aitubo:多功能AI繪畫平臺實現文生圖、圖生視頻與視頻編輯的無縫創作體驗

Aitubo是創新的AI圖像和視頻生成平臺,支持用戶免費創建游戲資產、動漫素材、藝術風格作品、角色設計、產品原型和攝影圖像。Aitubo基于先進的Flux模型,平臺...
閱讀原文

摩筆天書:智能AI繪本創作工具讓故事生動呈現

摩筆天書是摩爾線程推出的AI繪本創作工具,能輔助用戶基于AI技術生成兒童繪本。摩筆天書集成故事生成、圖像生成、語音合成和音樂創作等多種AI技術,提供從文...
閱讀原文