首個面向語境智能的人類級實時交互系統,支持多情感、多風格語音交互。
開源工業級自動語音識別模型,支持普通話、方言和英語,性能卓越。
一個用于生成對話式語音的模型,支持從文本和音頻輸入生成高質量的語音。
YuE是一個開源的音樂生成模型,能夠將歌詞轉化為完整的歌曲。
一個快速啟動帶有OpenAI集成的Django項目的模板。
一個為LLM生成Git提交信息的插件
一個開源的多云平臺客戶端,支持LangGraph代理和前端應用開發。
這是一個基于Qwen2.5-32B模型的4位量化版本,專為高效推理和低資源部署設計。
DeepSeek-R1-Zero 是一款通過大規模強化學習訓練的推理模型,無需監督微調即可實現卓越推理能力。
一個開源的編程助手工具,幫助開發者簡化編程任務。
DeepSeek-R1-Distill-Llama-8B 是一個高性能的開源語言模型,適用于文本生成和推理任務。
DeepSeek-R1-Distill-Qwen-7B 是一個開源的推理模型,專注于數學、代碼和推理任務。
Huginn-0125是一個35億參數的潛變量循環深度模型,擅長推理和代碼生成。
一個專注于超大規模系統設計和優化的工具,提供高效解決方案。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 構建,具備強大的推理和多領域應用能力。
一個用于構建Retrieval-Augmented Generation (RAG)應用的開源項目。
DeepSeek 是一款先進的 AI 語言模型,擅長邏輯推理、數學和編程任務,提供免費使用。
通過強化學習提升大型語言模型在開源軟件演變中的推理能力
兩個會話型AI代理在確認彼此為AI后切換到聲音級協議進行通信
Vibe Coder 是一款開源的 VS Code 擴展,用于探索基于語音的 AI 編程體驗。
Scira 是一個極簡主義的 AI 驅動搜索引擎,幫助用戶在互聯網上查找信息。
一種新穎的圖像到視頻采樣技術,基于Hunyuan模型實現高質量視頻生成。
Janus-Pro-1B 是一個統一多模態理解和生成的自回歸框架。
OmniParser 是一款通用屏幕解析工具,可將 UI 截圖轉換為結構化格式,提升基于 LLM 的 UI 代理性能。
Aya Vision 32B 是一個支持多語言的視覺語言模型,適用于OCR、圖像描述、視覺推理等多種用途。
Inductive Moment Matching 是一種新型的生成模型,用于高質量圖像生成。
一個基于音頻驅動的實時2D聊天頭像生成模型,可在僅使用CPU的設備上實現30fps的實時推理。
為Firefox瀏覽器翻譯功能優化的CPU加速神經機器翻譯模型。
百聆是一個類似GPT-4o的語音對話機器人,通過ASR+LLM+TTS實現,低配置也可運行,支持打斷。
DeepSeek-R1-Distill-Llama-70B 是一款基于強化學習優化的大型語言模型,專注于推理和對話能力。
SmolVLM-500M 是一個輕量級多模態模型,能夠處理圖像和文本輸入并生成文本輸出。
一個開源的聊天應用,使用Exa的API進行網絡搜索,結合Deepseek R1進行推理。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙