標簽:文本生成

Huxe AI

Huxe AI 是創新的個人音頻伴侶應用,由谷歌旗下熱門 AI 播客應用 NotebookLM 的核心團隊成員創立。通過生成式 AI 技術,將用戶關心的內容轉化為個性化的音頻...
閱讀原文

SmolVLA

SmolVLA 是 Hugging Face 開源的輕量級視覺-語言-行動(VLA)模型,專為經濟高效的機器人設計。擁有4.5億參數,模型小巧,可在CPU上運行,單個消費級GPU即可...
閱讀原文

LMEval

LMEval 是谷歌推出的開源框架,用在簡化大型模型(LLMs)的跨提供商評估。框架支持多模態(文本、圖像、代碼)和多指標評估,兼容 Google、OpenAI、Anthropic...
閱讀原文

Claude 4

Claude 4 是 Anthropic 公司推出的新一代 AI 模型,包括 Claude Opus 4 和 Claude Sonnet 4。Opus 4 是目前全球最強的編程模型,擅長復雜任務和長時間運行的...
閱讀原文

NLWeb

NLWeb 是微軟推出的開源項目,基于簡化網站自然語言界面的創建,讓任何網站都能變成 AI 驅動的應用程序。NLWeb用 Schema.org、RSS 等半結構化數據,結合 LLM ...
閱讀原文

Steamer-I2V

Steamer-I2V 是百度 Steamer 團隊推出的圖像到視頻生成模型,通過將靜態圖像轉化為動態視頻,展現出卓越的視覺生成能力。模型在 VBench 國際權威的視頻生成評...
閱讀原文

Seed1.5-VL

Seed1.5-VL 是字節跳動 Seed 團隊最新發布的視覺-語言多模態大模型,具備強大的通用多模態理解和推理能力,推理成本顯著降低。模型由一個 532M 參數的視覺編...
閱讀原文

Seed1.5-Embedding

Seed1.5-Embedding 是字節跳動 Seed 團隊最新發布的向量模型,基于 Seed1.5 (Doubao-1.5-pro) 進一步訓練。模型在權威測評榜單 MTEB 上達到了中英文 SOTA 效...
閱讀原文

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的多模態語言模型。模型在性能和成本之間實現平衡,接近甚至達到Claude Sonnet 3.7模型的性能水平,成本僅為后者的1/8(每...
閱讀原文

mrge

mrge 是高效智能的 AI 代碼審查平臺,專為提升開發團隊的代碼質量和審查效率設計。通過 AI 自動審核代碼,快速發現潛在缺陷、安全漏洞和性能問題,顯著節省開...
閱讀原文

風宇

風宇是中國氣象局聯合南昌大學和華為共同推出的全球首個全鏈式空間天氣大模型。模型基于創新的鏈式訓練結構,結合衛星觀測數據與數值模式數據,實現太陽風、...
閱讀原文

RepText

RepText 是Shakker Labs 和 Liblib AI推出的多語言視覺文本渲染框架,基于復制字形而非理解文本內容實現高質量的文本渲染。框架基于預訓練的單語言文本到圖像...
閱讀原文

NodeRAG

NodeRAG 是基于異構圖的檢索增強生成(Retrieval-Augmented Generation,RAG)系統。通過構建包含多種節點類型的異構圖,將文檔信息和語言模型生成的見解整合...
閱讀原文

文心大模型4.5 Turbo

文心大模型4.5 Turbo是百度推出的高性能、低成本多模態大模型。基于文心大模型4.5的基礎上進行優化,具備多模態、強推理能力,能處理文本、圖像等多種輸入形...
閱讀原文

Hummingbird-0

Hummingbird-0 是 Tavus 推出的AI口型同步模型。基于 Phoenix-3 模型開發,支持實現零樣本學習,無需額外訓練快速生成高精度的口型同步視頻。
閱讀原文
1234513