AI工具

MobileCLIP2

MobileCLIP2是蘋果公司研究人員推出的高效端側多模態模型,是MobileCLIP的升級版本。在多模態強化訓練方面進行了優化,通過在DFN數據集上訓練性能更優的CLIP...
閱讀原文

MAI-1-preview

MAI-1-preview 是微軟人工智能團隊推出的端到端訓練的基礎模型,為用戶提供遵循指令和回答日常查詢的能力。
閱讀原文

InternVL3.5

InternVL3.5(書生·萬象3.5)是上海人工智能實驗室開源的多模態大模型,模型在通用能力、推理能力和部署效率上全面升級,提供從10億到2410億參數的九種尺寸版...
閱讀原文

MAI-Voice-1

MAI-Voice-1 是微軟人工智能團隊推出的首個具有高度表現力和自然的語音生成模型。模型能在單個 GPU 上不到一秒鐘內生成一分鐘的音頻,是目前最高效的語音系統...
閱讀原文

Typeless

Typeless是智能語音轉錄工具,能自動去除語音中的語氣詞和重復內容,能根據上下文自動調整語氣和格式。Typeless支持100多種語言,能添加個人詞典,確保轉錄準...
閱讀原文

Async

Async 是開源的開發者工具,為經驗豐富的開發者提供結合AI編碼、任務管理和代碼審查的統一工作流,通過 AI 技術幫助開發者提高工作效率。
閱讀原文

ReadyBase

ReadyBase 是在線 AI 驅動的PDF生成工具,將原始數據或提示快速轉換為精美的 PDF 文檔。用戶只需輸入文字、數據或圖片等信息,平臺會根據內容自動生成排版清...
閱讀原文

VibeFlow

VibeFlow 是創新的無代碼開發平臺,支持用戶通過自然語言描述來構建全棧 Web 應用。用戶只需輸入簡單的提示詞,VibeFlow 的 AI 引擎能自動生成完整的后端邏輯...
閱讀原文

LoomlyAI

LoomlyAI 是專注于視覺內容解決方案的 AI 平臺,提供 AI 模特和智能換裝功能。基于 AI 模型取代傳統模特拍攝,快速生成高質量的商業圖片和視頻,解決模特拍攝...
閱讀原文

gpt-realtime

gpt-realtime 是 OpenAI 最新推出的先進語音模型,專為實際任務設計。模型能生成高質量、自然的語音,支持多種語言和語音風格,能理解非語言線索并根據場景調...
閱讀原文

OmniHuman-1.5

OmniHuman-1.5 字節推出的先進的AI模型,能從單張圖片和語音軌道生成富有表現力的數字人動畫。模型基于雙重系統認知理論,融合多模態大語言模型和擴散變換器...
閱讀原文

pillowtalk

pillowtalk是注重隱私的語音日記應用,能通過科學引導幫助用戶緩解壓力、改善睡眠。應用支持用戶語音或文字記錄日記,支持99種語言的轉錄,并提供個性化見解。
閱讀原文

Meeseeks

Meeseeks 是美團 M17 團隊開源的大模型評測集,用在評估模型的指令遵循能力。Meeseeks通過三級評測框架,從宏觀到微觀全面衡量模型是否能嚴格按照用戶指令生...
閱讀原文

HunyuanVideo-Foley

HunyuanVideo-Foley是騰訊混元團隊開源的端到端視頻音效生成模型。模型能根據輸入的視頻和文字描述,生成與視頻畫面精準匹配的高質量音效,解決現有AI視頻生...
閱讀原文

問小白5

問小白5是問小白推出的“All in One”旗艦大模型,是國產大模型中智能水平最高的。模型在多項評測中表現優異,如AA-Index綜合評估指標得分64.7分,STEM能力評測...
閱讀原文
14567820,763