標簽:智能語音助手
HART:自回歸視覺生成模型推動圖像生成的創新與精準
HART(Hybrid Autoregressive Transformer)是麻省理工學院研究團隊推出的自回歸視覺生成模型。能直接生成1024×1024像素的高分辨率圖像,質量媲美擴散模型。H...
Skywork o1:天工大模型4.0 O1版:智能生成與多模態交互的革新體驗
Skywork o1是昆侖萬維推出的天工大模型4.0 o1版,是國內首款具備中文邏輯推理能力的o1模型。Skywork o1在模型輸出中內生了思考、計劃、反思等能力,顯著提升...
Chonkie:多種文本分塊技術:基于Token、單詞、句子與語義的分析方法
Chonkie是輕量級、快速且功能豐富的RAG(Retrieval-Augmented Generation)分塊庫,為文本處理設計。Chonkie支持基于Token、單詞、句子和語義的多種分塊方法...
聲動視界:AI視頻工具在帶貨短視頻領域的翻譯與配音功能
聲動視界是面向帶貨短視頻的AI視頻工具。提供視頻翻譯、文本轉語音和視頻配音等功能,支持100多種語言,助力用戶將產品推廣至全球市場。基于音頻合成技術,聲...
Draw an Audio
Draw an Audio 是中國科學院自動化研究所和美團點評的研究人員推出的視頻生成音頻系統。根據視頻內容自動生成匹配的聲音效果,類似于電影制作中的 Foley 藝術...