標簽：多語言支持

EliGen

EliGen是浙江大學和阿里巴巴集團聯合開發的新型的實體級可控圖像生成框架，通過引入區域注意力機制，無需額外參數即可將實體提示和任意形狀的空間掩碼無縫集...

閱讀原文

AI工具

9個月前

Hibiki

Hibiki是Kyutai Labs開源的用在同時語音翻譯的解碼器模型，能實時將一種語言的語音翻譯成另一種語言的語音或文本。Hibiki基于多流語言模型架構，同步處理源語...

閱讀原文

AI工具

9個月前

Ola

Ola是清華大學、騰訊 Hunyuan 研究團隊和新加坡國立大學 S-Lab 合作開發的全模態語言模型。通過漸進式模態對齊策略，逐步擴展語言模型支持的模態，從圖像和文...

閱讀原文

AI工具

9個月前

BEN2

BEN2（Background Erase Network 2）是Prama LLC開發的深度學習模型，專門用于從圖像和視頻中快速移除背景并提取前景。基于創新的置信度引導摳圖（CGM）管道...

閱讀原文

AI工具

9個月前

播記

播記是專為播客創作者設計的智能節目筆記（Shownotes）生成工具。通過AI技術，能快速提取播客音頻中的關鍵信息，自動生成包含節目主題、嘉賓介紹、重要觀點、...

閱讀原文

AI工具

9個月前

SANA 1.5

SANA 1.5 是英偉達聯合MIT、清華、北大等機構推出的新型高效的線性擴散變換器（Linear Diffusion Transformer），用于文本到圖像生成任務。在 SANA 1.0 的基...

閱讀原文

AI工具

9個月前

倍客AI

倍客AI是專注于 AI 內容創作的平臺，通過人工智能技術為商業攝影、廣告設計、電商展示等領域提供高效、高質量的創意解決方案。平臺的核心功能包括 AI 商圖、A...

閱讀原文

AI工具

9個月前

JoyGen

JoyGen是京東科技和香港大學推出的，音頻驅動的3D說話人臉視頻生成框架，專注于實現精確的唇部與音頻同步及高質量的視覺效果。JoyGen結合音頻特征和面部深度...

閱讀原文

AI工具

9個月前

Le Chat APP

Le Chat APP是法國人工智能初創公司Mistral AI推出的AI對話助手應用。支持自然語言對話、實時網頁搜索、文檔分析和圖像生成等功能。Le Chat提供基礎版免費使...

閱讀原文

AI工具

9個月前

s1

s1是斯坦福大學和華盛頓大學的研究團隊開發的低成本、高性能的AI推理模型。模型通過“蒸餾”技術從谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推...

閱讀原文

AI工具

9個月前

LipRead Pro

LipRead Pro 是基于先進 AI 技術的視頻唇讀工具，能將視頻中的唇部動作轉換為文字。采用最新的深度學習模型，支持多種語言和口音，應用于內容創作、無障礙輔...

閱讀原文

AI工具

9個月前

LOOK

LOOK是實時AI時尚設計工具，專為時尚設計師開發。LOOK基于先進的AIGC技術，將設計概念即時轉化為視覺呈現，簡化傳統設計流程。設計師在Procreate中繪制草圖時...

閱讀原文

AI工具

9個月前

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架開源的 Android 手機應用，支持各類大語言模型（LLM）在手機上離線運行。具備多模態功能，能實現文本生成文本、圖像生...

閱讀原文

AI工具

9個月前

qeen.ai

qeen.ai 是谷歌和 DeepMind 前員工為電子商務企業提供自主 AI Agent平臺，幫助商家優化內容創作、營銷和對話銷售。 AI Agent 基于專有的 RL-UI 技術，實時從...

閱讀原文

AI工具

10個月前

繪聲美音

繪聲美音是免費的在線AI翻唱軟件，用戶無需下載，通過微信公眾號使用。支持聲音克隆與翻唱，用戶上傳3分鐘以上的語音即可訓練聲音模型，之后可選擇平臺提供的...

閱讀原文

AI工具

10個月前

1…19 202122 23…62