AI項目和框架

Indic Parler-TTS

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 團隊合作推出的多語言文本到語音(TTS)模型,專門用于印度語言和英語的語音合成。Indic Parler-TTS 是 Parl...
閱讀原文

ComfyUI-Copilot

ComfyUI-Copilot 是阿里巴巴國際數字商業集團(AIDC-AI)推出基于 ComfyUI 框架深度開發的 AI 智能助手。ComfyUI-Copilot給予自然語言交互,為用戶提供節點推...
閱讀原文

Auto-Deep-Research

Auto-Deep-Research 是香港大學黃超教授實驗室開源的全自動個人 AI 助理,作為 OpenAI Deep Research 的開源替代方案。基于 AutoAgent 框架開發,專注于深度...
閱讀原文

Ovis2

Ovis2 是阿里巴巴國際團隊推出的新型多模態大語言模型,基于結構化嵌入對齊解決視覺與文本模態間的差異。Ovis2繼承、優化了 Ovis 系列架構,強化小規模模型的...
閱讀原文

AgentSociety

AgentSociety 是清華大學推出的基于大語言模型(LLM)的社會模擬器,通過構建具有“類人心智”的智能體來模擬復雜的社會行為和現象。結合社會學理論,賦予智能...
閱讀原文

Sitcom-Crafter

Sitcom-Crafter 是北京航空航天大學、香港中文大學(深圳)、悉尼科技大學、中山大學等高校聯合推出的 3D 場景中人類動作生成系統。基于用戶提供的長劇情指導...
閱讀原文

Migician

Migician是北京交通大學、華中科技大學和清華大學的研究團隊聯合推出的多模態大語言模型(MLLM),專門用在自由形式的多圖像定位(Multi-Image Grounding, MI...
閱讀原文

協和·太初

協和·太初是北京協和醫院與中國科學院自動化研究所共同研發的國內首個罕見病領域AI大模型,正式進入臨床應用。模型基于我國罕見病知識庫的多年積累和中國人群...
閱讀原文

HiveChat

HiveChat 是為中小團隊設計的 AI 聊天應用,支持多種主流 AI 模型,如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具備 LaTeX 和 Markdown 渲染、圖像...
閱讀原文

BioEmu

BioEmu是微軟研究院推出的生成式深度學習系統,高效模擬蛋白質的動態結構和平衡態構象。能在單個GPU上每小時生成數千種蛋白質結構樣本,效率遠超傳統的分子動...
閱讀原文

Crawl4LLM

Crawl4LLM 是清華大學和卡內基梅隆大學聯合開源的智能爬蟲系統,提升大語言模型(LLM)預訓練效率。Crawl4LLM基于智能評估網頁對 LLM 預訓練的價值,優先抓取...
閱讀原文

AI co-scientist

AI co-scientist 是谷歌推出的多智能體AI系統,作為虛擬科研機器人,協助科研人員搞定各種繁瑣的科研任務,包括科研選題、文獻檢索和實驗設計。AI co-scienti...
閱讀原文

PaliGemma 2 mix

PaliGemma 2 Mix是谷歌DeepMind發布的最新多任務視覺語言模型(VLM)。集成了多種視覺和語言處理能力,支持圖像描述、目標檢測、圖像分割、OCR以及文檔理解等...
閱讀原文

FlexTok

FlexTok 是瑞士洛桑聯邦理工學院(EPFL)和蘋果公司聯合開發的圖像處理技術。通過將二維圖像重新采樣為一維離散標記序列(token sequences),以靈活的長度描...
閱讀原文

TongGeometry

TongGeometry 是北京通用AI研究院和北京大學AI研究所聯合推出的基于樹搜索的幾何模型,專門用在提出和解決奧林匹克級別的幾何問題。TongGeometry基于高效的搜...
閱讀原文
17071727374155