標簽:自然語言處理

口語精靈

口語精靈是AI口語學習軟件,通過先進的人工智能技術和真人語音模擬,為用戶提供1V1的對話練習體驗。用戶可以隨時隨地與AI老師互動,跨越國界,學習不同地區的...
閱讀原文

ACTalker

ACTalker 是用于生成逼真說話人頭部視頻的端到端視頻擴散框架。支持單信號或多信號控制,如音頻、表情等。核心架構包括并行 Mamba 結構,通過多個分支利用不...
閱讀原文

Quasar Alpha

Quasar Alpha 是 OpenRouter 發布的預發布版 AI 模型。擁有 100 萬 token 的超大上下文窗口,可處理超長文本和復雜文檔。代碼生成能力出色,生成速度快,延遲...
閱讀原文

OmniTalker

OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...

枝頁

枝頁(iBleaf)是基于金字塔原理設計的AI筆記工具,幫助用戶將碎片化的知識整理成清晰有序的知識體系。通過知識樹的形式,讓用戶能以層級化的結構組織筆記,...
閱讀原文

Dolphin

Dolphin是清華大學電子工程系語音與音頻技術實驗室聯合海天瑞聲共同推出的面向東方語言的語音大模型。支持40個東方語種的語音識別,中文語種涵蓋22種方言(含...
閱讀原文

OpenAI Academy

OpenAI Academy是OpenAI推出的免費AI學習平臺,提供免費的AI課程幫助普通人掌握AI技能。OpenAI Academy提供豐富多樣的課程,包括《ChatGPT Edu學術助手指南》...
閱讀原文

AutoAgent

AutoAgent 是香港大學推出的零代碼、自動化 LLM 智能體框架。基于自然語言交互,讓用戶無需編程即可創建智能助手,適用于智能搜索、數據分析、報告生成等場景...
閱讀原文

Amodal3R

Amodal3R 是條件式 3D 生成模型,能從部分可見的 2D 物體圖像中推測并重建完整的 3D 形態和外觀。模型基于“基礎”3D 生成模型 TRELLIS 構建,通過引入掩碼加權...
閱讀原文

Amazon Nova Act

Amazon Nova Act是亞馬遜 AGI Labs推出的通用AI代理,用于在網頁瀏覽器中執行任務。Amazon Nova Act支持開發者基于配套的 SDK 構建智能體應用原型,完成如提...
閱讀原文

Actor Mode

Actor Mode 是 ElevenLabs 推出的AI語音生成工具,支持用戶通過自己的聲音指導 AI 生成語音內容。用戶只需錄制一段音頻或上傳已有音頻文件,AI 能分析其語調...
閱讀原文

GLM-Z1-Air

GLM-Z1-Air 是智譜公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在預訓練階段引入更多推理類數據,在對齊階段深度優化通用能力,展現出強大的數...
閱讀原文

GLM-4-Air-0414

GLM-4-Air-0414是智譜公司推出的擁有320億參數的基座模型,是AutoGLM沉思背后的模型。GLM-4-Air-0414在預訓練階段加入更多代碼類、推理類數據,針對智能體能...
閱讀原文

Alpha Engine

Alpha Engine 是面向全球資本市場的 AI 投研平臺,為投研人員提供高效、智能的投研解決方案。擁有全面深度的投研數據庫,涵蓋海量會議紀要、海內外研報等資料...
閱讀原文

OpenDeepSearch

OpenDeepSearch 是開源的深度搜索工具,基于開源推理模型和推理代理提升搜索性能,專為? Hugging Face 的 SmolAgents 無縫集成進行優化,支持深度網絡搜索和...
閱讀原文
191011121367