AI項(xiàng)目和框架

Psi R0

Psi R0是靈初智能發(fā)布的首個(gè)基于強(qiáng)化學(xué)習(xí)的端到端具身模型。支持雙靈巧手協(xié)同進(jìn)行復(fù)雜操作,能夠?qū)⒍鄠€(gè)技能串聯(lián)混訓(xùn),生成具有推理能力的智能體,完成并閉環(huán)...
閱讀原文

FireCrawl

FireCrawl是開源的AI爬蟲工具,專門用在Web數(shù)據(jù)提取,轉(zhuǎn)換為Markdown或其他結(jié)構(gòu)化數(shù)據(jù)。FireCrawl具備強(qiáng)大的抓取能力,支持動態(tài)網(wǎng)頁內(nèi)容處理,提供智能爬取狀...
閱讀原文

VideoVAE+

VideoVAE+(VideoVAE Plus)是香港科技大學(xué)團(tuán)隊(duì)推出的先進(jìn)的跨模態(tài)視頻變分自編碼器(Video VAE),通過引入新的時(shí)空分離壓縮機(jī)制和文本指導(dǎo),實(shí)現(xiàn)了對大幅運(yùn)...
閱讀原文

Languine

Languine 是 AI 驅(qū)動的翻譯工具,能幫助開發(fā)者簡化應(yīng)用程序的開發(fā)過程。Languine 基于智能檢測、AI 翻譯、自動化工作流程和開發(fā)者友好的設(shè)計(jì),讓翻譯管理變得...
閱讀原文

AgiBot World

AgiBot World是智元機(jī)器人開源的百萬真機(jī)數(shù)據(jù)集,旨在推動具身智能的發(fā)展。數(shù)據(jù)集包含八十余種日常技能,覆蓋家居、餐飲、工業(yè)等五大核心場景,數(shù)據(jù)規(guī)模和質(zhì)...
閱讀原文

GraphAgent

GraphAgent是香港大學(xué)和香港科技大學(xué)(廣州)聯(lián)合推出的智能圖形語言助手,能處理現(xiàn)實(shí)世界中結(jié)構(gòu)化(如圖連接)和非結(jié)構(gòu)化(如文本、視覺信息)格式的數(shù)據(jù),...
閱讀原文

DeepSeek Engineer

DeepSeek Engineer 是集成DeepSeek API 的AI編程助手,基于命令行界面讓用戶能讀取本地文件、創(chuàng)建新文件及實(shí)時(shí)對現(xiàn)有文件進(jìn)行差異編輯。DeepSeek Engineer用 ...
閱讀原文

VideoPhy

VideoPhy是UCLA和谷歌研究研究院聯(lián)合推出的,首個(gè)評估視頻生成模型物理常識能力的基準(zhǔn)測試,能衡量模型生成的視頻是否遵循現(xiàn)實(shí)世界的物理規(guī)則。VideoPhy基準(zhǔn)...
閱讀原文

Large Motion Model

Large Motion Model(LMM)是統(tǒng)一的多模態(tài)運(yùn)動生成模型,是新加坡南洋理工大學(xué)S-Lab和商湯科技研究團(tuán)隊(duì)共同推出的。LMM能處理包括文本到運(yùn)動、音樂到舞蹈等多...
閱讀原文

StereoCrafter

StereoCrafter是騰訊AI Lab和ARC Lab共同推出的創(chuàng)新框架,能將單目視頻(2D視頻)轉(zhuǎn)換為立體3D視頻,滿足日益增長的3D內(nèi)容需求。StereoCrafter基于深度估計(jì)、...
閱讀原文

SPAR

SPAR是智譜團(tuán)隊(duì)推出的自我博弈框架,能增強(qiáng)大型語言模型在遵循指令方面的能力??蚣芑趦?nèi)部的生成者和完善者兩個(gè)角色進(jìn)行互動,生成者執(zhí)行指令生成回復(fù),完...
閱讀原文

LowCodeEngine

LowCodeEngine是阿里巴巴開源的低代碼開發(fā)框架,基于提供拖拽、配置等簡單操作,讓開發(fā)者快速構(gòu)建復(fù)雜的系統(tǒng)頁面??蚣芤詮?qiáng)大的定制能力、優(yōu)雅的開發(fā)體驗(yàn)、豐...
閱讀原文

Qwen-Agent

Qwen-Agent是基于通義千問模型(Qwen)的開源Agent開發(fā)框架,支持開發(fā)者用Qwen模型的指令遵循、工具使用、規(guī)劃和記憶能力構(gòu)建智能代理應(yīng)用。Qwen-Agent支持函...
閱讀原文

Mind GPT-3o

Mind GPT-3o是理想汽車推出的多模態(tài)端到端大模型,融合語音、視覺和語言理解技術(shù),實(shí)現(xiàn)高效實(shí)時(shí)交互。Mind GPT-3o具備記憶、規(guī)劃、工具使用和表達(dá)能力,能提...
閱讀原文

瑯琊

瑯琊是中國科學(xué)院海洋研究所自主研發(fā)的新一代海洋人工智能大模型1.0版本,專注于海洋狀態(tài)變量預(yù)報(bào)。模型結(jié)合了先進(jìn)的人工智能算法和專業(yè)的海洋科學(xué)知識,能實(shí)...
閱讀原文
17879808182146