標簽:多語言支持

Ola

Ola是清華大學、騰訊 Hunyuan 研究團隊和新加坡國立大學 S-Lab 合作開發的全模態語言模型。通過漸進式模態對齊策略,逐步擴展語言模型支持的模態,從圖像和文...
閱讀原文

BEN2

BEN2(Background Erase Network 2)是Prama LLC開發的深度學習模型,專門用于從圖像和視頻中快速移除背景并提取前景。基于創新的置信度引導摳圖(CGM)管道...
閱讀原文

播記

播記是專為播客創作者設計的智能節目筆記(Shownotes)生成工具。通過AI技術,能快速提取播客音頻中的關鍵信息,自動生成包含節目主題、嘉賓介紹、重要觀點、...
閱讀原文

SANA 1.5

SANA 1.5 是英偉達聯合MIT、清華、北大等機構推出的新型高效的線性擴散變換器(Linear Diffusion Transformer),用于文本到圖像生成任務。在 SANA 1.0 的基...
閱讀原文

倍客AI

倍客AI是專注于 AI 內容創作的平臺,通過人工智能技術為商業攝影、廣告設計、電商展示等領域提供高效、高質量的創意解決方案。平臺的核心功能包括 AI 商圖、A...
閱讀原文

JoyGen

JoyGen是京東科技和香港大學推出的,音頻驅動的3D說話人臉視頻生成框架,專注于實現精確的唇部與音頻同步及高質量的視覺效果。JoyGen結合音頻特征和面部深度...
閱讀原文

Le Chat APP

Le Chat APP是法國人工智能初創公司Mistral AI推出的AI對話助手應用。支持自然語言對話、實時網頁搜索、文檔分析和圖像生成等功能。Le Chat提供基礎版免費使...
閱讀原文

s1

s1是斯坦福大學和華盛頓大學的研究團隊開發的低成本、高性能的AI推理模型。模型通過“蒸餾”技術從谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推...
閱讀原文

LipRead Pro

LipRead Pro 是基于先進 AI 技術的視頻唇讀工具,能將視頻中的唇部動作轉換為文字。采用最新的深度學習模型,支持多種語言和口音,應用于內容創作、無障礙輔...
閱讀原文

LOOK

LOOK是實時AI時尚設計工具,專為時尚設計師開發。LOOK基于先進的AIGC技術,將設計概念即時轉化為視覺呈現,簡化傳統設計流程。設計師在Procreate中繪制草圖時...
閱讀原文

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架開源的 Android 手機應用,支持各類大語言模型(LLM)在手機上離線運行。具備多模態功能,能實現文本生成文本、圖像生...
閱讀原文

qeen.ai

qeen.ai 是谷歌和 DeepMind 前員工為電子商務企業提供自主 AI Agent平臺,幫助商家優化內容創作、營銷和對話銷售。 AI Agent 基于專有的 RL-UI 技術,實時從...
閱讀原文

繪聲美音

繪聲美音是免費的在線AI翻唱軟件,用戶無需下載,通過微信公眾號使用。支持聲音克隆與翻唱,用戶上傳3分鐘以上的語音即可訓練聲音模型,之后可選擇平臺提供的...
閱讀原文

Hika

Hika是國內五人團隊開發的免費AI知識搜索工具,通過個性化交互和多維度知識探索,幫助用戶獲得更全面和深入的搜索結果。與傳統AI搜索工具不同,不追求“一步到...
閱讀原文

MILS

MILS(Multimodal Iterative LLM Solver)是Meta AI提出的無需訓練即可賦予大型語言模型(LLM)多模態能力的方法。通過多步推理,提示LLM生成候選輸出,對每...
閱讀原文
1192021222361