AI項目和框架

Migician

Migician是北京交通大學、華中科技大學和清華大學的研究團隊聯(lián)合推出的多模態(tài)大語言模型(MLLM),專門用在自由形式的多圖像定位(Multi-Image Grounding, MI...
閱讀原文

協(xié)和·太初

協(xié)和·太初是北京協(xié)和醫(yī)院與中國科學院自動化研究所共同研發(fā)的國內(nèi)首個罕見病領(lǐng)域AI大模型,正式進入臨床應用。模型基于我國罕見病知識庫的多年積累和中國人群...
閱讀原文

HiveChat

HiveChat 是為中小團隊設計的 AI 聊天應用,支持多種主流 AI 模型,如 OpenAI、Claude、Gemini 和 Deepseek 等。HiveChat具備 LaTeX 和 Markdown 渲染、圖像...
閱讀原文

BioEmu

BioEmu是微軟研究院推出的生成式深度學習系統(tǒng),高效模擬蛋白質(zhì)的動態(tài)結(jié)構(gòu)和平衡態(tài)構(gòu)象。能在單個GPU上每小時生成數(shù)千種蛋白質(zhì)結(jié)構(gòu)樣本,效率遠超傳統(tǒng)的分子動...
閱讀原文

Crawl4LLM

Crawl4LLM 是清華大學和卡內(nèi)基梅隆大學聯(lián)合開源的智能爬蟲系統(tǒng),提升大語言模型(LLM)預訓練效率。Crawl4LLM基于智能評估網(wǎng)頁對 LLM 預訓練的價值,優(yōu)先抓取...
閱讀原文

AI co-scientist

AI co-scientist 是谷歌推出的多智能體AI系統(tǒng),作為虛擬科研機器人,協(xié)助科研人員搞定各種繁瑣的科研任務,包括科研選題、文獻檢索和實驗設計。AI co-scienti...
閱讀原文

PaliGemma 2 mix

PaliGemma 2 Mix是谷歌DeepMind發(fā)布的最新多任務視覺語言模型(VLM)。集成了多種視覺和語言處理能力,支持圖像描述、目標檢測、圖像分割、OCR以及文檔理解等...
閱讀原文

FlexTok

FlexTok 是瑞士洛桑聯(lián)邦理工學院(EPFL)和蘋果公司聯(lián)合開發(fā)的圖像處理技術(shù)。通過將二維圖像重新采樣為一維離散標記序列(token sequences),以靈活的長度描...
閱讀原文

TongGeometry

TongGeometry 是北京通用AI研究院和北京大學AI研究所聯(lián)合推出的基于樹搜索的幾何模型,專門用在提出和解決奧林匹克級別的幾何問題。TongGeometry基于高效的搜...
閱讀原文

流暢閱讀

流暢閱讀(FluentRead)是開源的瀏覽器翻譯插件,致力于為用戶提供類似母語的閱讀體驗。流暢閱讀基于先進的AI技術(shù),支持多種翻譯引擎,包括傳統(tǒng)機器翻譯和AI...
閱讀原文

ToddlerBot

ToddlerBot是斯坦福大學開源的用在運動操作的開源機器學習與人形機器人平臺,為高效收集大規(guī)模、高質(zhì)量的訓練數(shù)據(jù)設計。ToddlerBot具備30個主動自由度,用Dyn...
閱讀原文

Aider

Aider 是開源的AI輔助編程工具,基于終端與大型語言模型(LLM)配合,實現(xiàn)高效代碼編輯和開發(fā)。Aider支持多種編程語言,如 Python、JavaScript、TypeScript ...
閱讀原文

LLaDA

LLaDA(Large Language Diffusion with mAsking)是中國人民大學高瓴AI學院李崇軒、文繼榮教授團隊和螞蟻集團共同推出的新型大型語言模型,基于擴散模型框架...
閱讀原文

Agentic Reasoning

Agentic Reasoning是牛津大學推出的增強大型語言模型(LLM)推理能力的框架。基于整合外部工具(如網(wǎng)絡搜索、代碼執(zhí)行和結(jié)構(gòu)化記憶)解決復雜的多步驟推理問...
閱讀原文

瑞智病理大模型

瑞智病理大模型(RuiPath)是上海交通大學醫(yī)學院附屬瑞金醫(yī)院與華為共同推出的臨床級國產(chǎn)多模態(tài)互動式病理大模型。模型覆蓋了中國每年全癌種發(fā)病人數(shù)90%的常...
閱讀原文
16162636465146