標簽:多語言支持

Granola

Granola是專為頻繁參加會議的人設計的AI會議助手工具。能實時轉錄會議內容,自動識別發言者并標注時間戳,支持用戶在會議中實時添加筆記和標記重點。會議結束...
閱讀原文

X-Prompt

X-Prompt是用于多模態視頻目標分割的通用框架,解決傳統方法在極端光照、快速運動和背景干擾等復雜場景下的局限性。通過預訓練一個基于 RGB 數據的視頻目標分...
閱讀原文

BitsAI-CR

BitsAI-CR是字節跳動團隊推出的基于大型語言模型(LLM)的自動化代碼審查工具,通過兩階段處理流程實現高效代碼審查:RuleChecker 負責基于 219 條規則檢測潛...
閱讀原文

Pipecat

Pipecat是開源的Python框架,專注于構建語音和多模態對話代理。基于內置的語音識別、文本轉語音(TTS)和對話處理功能,簡化AI服務的復雜協調、網絡傳輸、音...
閱讀原文

GLM-Realtime

GLM-Realtime是智譜推出的全新端到端多模態模型,具備低延遲的視頻理解與語音交互能力,特別融入清唱功能,讓大模型在對話中能展現歌唱才能。模型支持長達2分...
閱讀原文

Aibiye

Aibiye是AI論文寫作輔助平臺,基于Multimodal+Global Thought Chain語言模型,為用戶提供從開題報告到完整論文的生成服務。用戶只需輸入關鍵詞、選擇專業和字...
閱讀原文

LlamaV-o1

LlamaV-o1是阿聯酋穆罕默德·本·扎耶德人工智能大學等機構提出的新多模態視覺推理模型,旨在提升大型語言模型的逐步視覺推理能力。引入視覺推理鏈基準測試VRC-...
閱讀原文

Kokoro-TTS

Kokoro-TTS 是 hexgrad 開發的輕量級文本轉語音(TTS)模型,具有 8200 萬參數。基于 StyleTTS 2 和 ISTFTNet 的混合架構,采用純解碼器設計,不使用擴散模型...
閱讀原文

訊飛星火 X1

訊飛星火 X1 是科大訊飛于2025年1月15日發布的國內首個基于全國產算力平臺訓練的具備深度思考和推理能力的大模型。在解題過程中更接近人類的“慢思考”方式,僅...
閱讀原文

星火語音同傳大模型

星火語音同傳大模型是科大訊飛于2025年1月15日發布的國內首個具備端到端語音同傳能力的大模型。模型在內容完整度、信息準確度以及語言質量上均處于行業領先水...
閱讀原文

Eko

Eko是Fellou AI推出的生產就緒型JavaScript框架,基于自然語言驅動的方式,幫助開發者輕松創建從簡單指令到復雜流程的可靠智能代理。Eko支持所有平臺,包括計...
閱讀原文

Banger

Banger是以AI翻唱為核心的AI音樂應用,用戶能通過簡單的步驟將喜歡的歌曲進行翻唱創作。應用內置了大量素材模板,引入個性化算法推薦功能,支持從YouTube提取...
閱讀原文

碼上飛

碼上飛(CodeFlying)是無需編程基礎的AI智能軟件開發平臺。用戶只需用自然語言描述需求,AI能自動生成端到端的應用程序,從需求分析到代碼生成、測試、部署...
閱讀原文

新言意碼

新言意碼是專注于AI編程應用開發的公司,由前月之暗面海外產品Noisee的明超平創立。公司全稱深圳新言意碼科技有限公司,成立于2024年9月23日,位于廣東省深圳...
閱讀原文

PPTAgent

PPTAgent是中國科學院軟件研究所中文信息處理實驗室推出的創新框架,基于模仿人類工作流程的兩階段編輯方法,從文檔自動生成高質量的演示文稿。PPTAgent分析...
閱讀原文
1202122232461