AI項(xiàng)目和框架

Pemo

Pemo是AI驅(qū)動(dòng)的文檔管理工具。工具支持PDF、Epub、Word等多種格式文檔的導(dǎo)入與管理,具備一鍵翻譯、智能總結(jié)、思維導(dǎo)圖生成等功能,幫助用戶快速理解復(fù)雜文獻(xiàn)...
閱讀原文

OpenMemory MCP

OpenMemory MCP 是mem0推出的基于開放模型上下文協(xié)議(MCP)構(gòu)建的開源工具,能解決 AI 工具記憶痛點(diǎn),實(shí)現(xiàn)不同工具間共享上下文信息。OpenMemory MCP支持 10...
閱讀原文

Toolkami

Toolkami 是極簡的 AI Agent 框架,用七種工具支持運(yùn)行, 包括讀(Read)、寫(Write Diff)、瀏覽(Browse)、命令(Command)、提問(Ask)、思考(Think)??蚣苤С?T...
閱讀原文

SWE-1

SWE-1是Windsurf團(tuán)隊(duì)推出的首個(gè)軟件工程 AI 模型系列,專為整個(gè)軟件開發(fā)流程優(yōu)化,涵蓋代碼生成、測試、調(diào)試、資料查找等開發(fā)環(huán)節(jié),提升開發(fā)效率和用戶體驗(yàn)。
閱讀原文

DICE-Talk

DICE-Talk是復(fù)旦大學(xué)聯(lián)合騰訊優(yōu)圖實(shí)驗(yàn)室推出的新穎情感化動(dòng)態(tài)肖像生成框架,支持生成具有生動(dòng)情感表達(dá)且保持身份一致性的動(dòng)態(tài)肖像視頻。DICE-Talk引入情感關(guān)...
閱讀原文

混元圖像2.0

混元圖像2.0(Hunyuan Image 2.0)是騰訊推出的業(yè)內(nèi)首個(gè)毫秒級響應(yīng)的實(shí)時(shí)生圖大模型?;煸獔D像2.0支持文本、語音、草圖等多種交互方式,用戶輸入指令后,圖像...
閱讀原文

Paper2Coder

Paper2Coder 是韓國科學(xué)技術(shù)院推出的多智能體大語言模型(LLM)系統(tǒng),支持將機(jī)器學(xué)習(xí)領(lǐng)域的科學(xué)論文自動(dòng)轉(zhuǎn)換為代碼庫?;谝?guī)劃、分析和代碼生成三個(gè)階段,將...
閱讀原文

Sketch2Anim

Sketch2Anim 是愛丁堡大學(xué)聯(lián)合Snap Research、東北大學(xué)推出的自動(dòng)化框架,能將2D草圖故事板直接轉(zhuǎn)換為高質(zhì)量的3D動(dòng)畫?;跅l件運(yùn)動(dòng)合成技術(shù),用3D關(guān)鍵姿勢、...
閱讀原文

Speech-02

Speech-02 是 MiniMax 推出的新一代文本到語音(TTS)模型。模型基于回歸 Transformer 架構(gòu),實(shí)現(xiàn)零樣本語音克隆,僅需幾秒?yún)⒖颊Z音能生成高度相似的目標(biāo)語音...
閱讀原文

Stable Audio Open Small

Stable Audio Open Small 是 Stability AI 與 Arm 合作推出的輕量級文本到音頻生成模型。基于 Stable Audio Open 模型,參數(shù)量從11億減少到3.41億,生成速度...
閱讀原文

FaceShot

FaceShot是同濟(jì)大學(xué)、上海 AI Lab和南京理工大學(xué)推出的新型無需訓(xùn)練的肖像動(dòng)畫生成框架。用外觀引導(dǎo)的地標(biāo)匹配模塊和基于坐標(biāo)的地標(biāo)重定位模塊,為各種角色生...
閱讀原文

MT-Color

MT-Color是上海交通大學(xué)聯(lián)合嗶哩嗶哩推出的基于擴(kuò)散模型的可控圖像著色框架,基于用戶提供的實(shí)例感知文本和掩碼實(shí)現(xiàn)精確的實(shí)例級圖像著色。框架基于像素級掩...
閱讀原文

Being-M0

Being-M0 是北京大學(xué)、中國人民大學(xué)等機(jī)構(gòu)聯(lián)合推出的首個(gè)大規(guī)模人形機(jī)器人通用動(dòng)作生成模型。Being-M0 基于業(yè)界首個(gè)百萬級動(dòng)作數(shù)據(jù)集 MotionLib,用創(chuàng)新的 Mo...
閱讀原文

DanceGRPO

DanceGRPO 是字節(jié)跳動(dòng) Seed 和香港大學(xué)聯(lián)合推出的首個(gè)統(tǒng)一視覺生成強(qiáng)化學(xué)習(xí)框架。將強(qiáng)化學(xué)習(xí)應(yīng)用在視覺生成領(lǐng)域,覆蓋兩大生成范式(diffusion 和 rectified ...
閱讀原文

AlphaEvolve

AlphaEvolve是谷歌DeepMind推出的通用科學(xué)Agent,基于結(jié)合大型語言模型(LLMs)的創(chuàng)造力和自動(dòng)評估器來設(shè)計(jì)和優(yōu)化高級算法。用Gemini Flash和Gemini Pro兩種...
閱讀原文
1234117