標簽:數據驅動決策

T2V-01-Director

T2V-01-Director 是海螺AI(MiniMax)推出的文本到視頻生成工具,專注于通過自然語言指令實現精準的鏡頭運動控制。支持用戶在生成視頻時,通過簡單的文字描述...

EPLB

EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的專家并行負載均衡器,能解決大規模模型訓練中不同專家模型(Expert)負載不均的問題。EPLB 基于...
閱讀原文

Wan2.1

Wan2.1是阿里云開源的AI視頻生成大模型,具備強大的視覺生成能力。Wan2.1支持文生視頻和圖生視頻任務,包含兩種尺寸的模型,14B參數的專業版擅長復雜運動生成...
閱讀原文

HiveChat

HiveChat 是為中小團隊設計的 AI 聊天應用,支持多種主流 AI 模型,如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具備 LaTeX 和 Markdown 渲染、圖像...
閱讀原文

Signs

Signs 是英偉達(Nvidia)推出的基于 AI 的手語學習平臺,幫助用戶更高效地學習美式手語(ASL)。平臺通過攝像頭捕捉用戶的動作,基于先進的 AI 技術實時分析...
閱讀原文

瑞智病理大模型

瑞智病理大模型(RuiPath)是上海交通大學醫學院附屬瑞金醫院與華為共同推出的臨床級國產多模態互動式病理大模型。模型覆蓋了中國每年全癌種發病人數90%的常...
閱讀原文

DynamicCity

DynamicCity 是上海AI Lab推出的大規模動態場景生成的4D生成框架。DynamicCity 專注于生成具有語義信息的動態 LiDAR 場景,能處理大規模空間(80×80×6.4 m3)...
閱讀原文

NobodyWho

NobodyWho是為 Godot 游戲引擎設計的插件,通過本地運行的大型語言模型(LLM)實現互動小說創作。支持 Windows、Linux 和 macOS 平臺,用戶無需聯網即可使用...
閱讀原文

Webdone

Webdone 是基于人工智能的在線平臺,幫助用戶快速創建和定制高質量的落地頁和網站。通過強大的 AI 技術,讓用戶只需簡單描述產品或需求,可在幾分鐘內生成專...
閱讀原文

Scam AI

Scam AI 是基于人工智能的防詐騙平臺,幫助用戶快速驗證視頻、音頻和文本內容的真實性,識別潛在的詐騙行為。通過自然語言處理(NLP)、視覺和音頻認證技術,...
閱讀原文

DeepRAG

DeepRAG 是中科院、中科大和騰訊微信AI部聯合推出的新型檢索增強生成(RAG)框架,提升大型語言模型(LLMs)在推理和檢索任務中的性能。通過將檢索增強推理建...
閱讀原文

MILS

MILS(Multimodal Iterative LLM Solver)是Meta AI提出的無需訓練即可賦予大型語言模型(LLM)多模態能力的方法。通過多步推理,提示LLM生成候選輸出,對每...
閱讀原文

ConceptMaster

ConceptMaster是用于多概念視頻定制的創新框架,能在無需測試時調優的情況下,在擴散Transformer模型上生成高質量且概念一致的定制視頻。框架通過學習解耦的...
閱讀原文

LongDocURL

LongDocURL是中國科學院自動化研究所和阿里巴巴淘寶天貓集團聯合發布的多模態長文檔理解基準數據集。專注于評估模型在處理長文檔、復雜元素和多樣化任務中的...
閱讀原文

TryOffAnyone

TryOffAnyone是能將穿著服裝的人物照片轉換成平鋪的服裝展示圖的AI工具。基于先進的Latent Diffusion Models技術,自動識別并提取照片中的服裝區域,然后將其...
閱讀原文