AI項(xiàng)目和框架

Nanobrowser

Nanobrowser 是開源的 Chrome 擴(kuò)展工具,專注于 AI 驅(qū)動(dòng)的網(wǎng)頁自動(dòng)化。Nanobrowser基于多智能體系統(tǒng)實(shí)現(xiàn)復(fù)雜的網(wǎng)頁任務(wù),如信息提取、自動(dòng)化操作等。用戶用自...
閱讀原文

DINO-XSeek

DINO-XSeek 是 IDEA 研究院推出的多模態(tài)目標(biāo)檢測模型,結(jié)合視覺感知和自然語言理解能力。DINO-XSeek基于復(fù)雜的語言描述精準(zhǔn)定位圖像中的目標(biāo),識(shí)別目標(biāo)的屬性...
閱讀原文

AppAgentX

AppAgentX 是西湖大學(xué)推出的新型自我進(jìn)化式 GUI(圖形用戶界面)代理框架,基于從執(zhí)行歷史中抽象出高級動(dòng)作提升代理在智能手機(jī)交互中的效率和智能性。AppAgen...
閱讀原文

URO-Bench

URO-Bench 是面向端到端語音對話模型(SDMs)的全面基準(zhǔn)測試工具。涵蓋了多語言、多輪對話、副語言信息等多維度任務(wù),全面評估語音對話模型的性能。

GCDance

GCDance(Genre-Controlled 3D Full Body Dance Generation Driven by Music)是英國薩里大學(xué)和江南大學(xué)推出的3D舞蹈生成框架,能根據(jù)音樂和文本提示生成符合...
閱讀原文

LaWGPT

LaWGPT 是南京大學(xué)推出的中文法律大語言模型,基于 LLaMA 模型進(jìn)行二次預(yù)訓(xùn)練,融入大量中文法律知識(shí)。專注于法律領(lǐng)域,能理解和生成與法律相關(guān)的文本,適用...
閱讀原文

OpenManus

OpenManus 是MetaGPT 團(tuán)隊(duì)推出的開源復(fù)刻版?Manus,提供無需邀請碼的 AI Agent 。OpenManus基于模塊化設(shè)計(jì),支持多種語言模型和工具鏈,能執(zhí)行代碼、處理文件...
閱讀原文

NEXUS-O

NEXUS-O 是HiThink 研究院、英國帝國理工學(xué)院、浙江大學(xué)、復(fù)旦大學(xué)、微軟、Meta AI等機(jī)構(gòu)推出的多模態(tài)AI模型,能實(shí)現(xiàn)對語言、音頻和視覺信息的全方位感知與交...
閱讀原文

OWL

OWL(Optimized Workforce Learning)是基于CAMEL-AI框架開發(fā)的多智能體協(xié)作系統(tǒng),通過智能體之間的動(dòng)態(tài)交互實(shí)現(xiàn)高效的任務(wù)自動(dòng)化。通過角色分配和任務(wù)分解,...
閱讀原文

TicVoice 7.0

TicVoice 7.0 是出門問問推出的第七代高品質(zhì) TTS(語音合成)引擎,基于新一代語音生成模型 Spark-TTS 。TicVoice 7.0基于創(chuàng)新的 BiCodec 編碼方式,將語音分...
閱讀原文

GEN3C

GEN3C 是NVIDIA、多倫多大學(xué)和向量研究所推出的新型生成式視頻模型,基于精確的相機(jī)控制和時(shí)空一致性生成高質(zhì)量的 3D 視頻內(nèi)容。GEN3C構(gòu)建基于點(diǎn)云的 3D 緩存...
閱讀原文

Mercury Coder

Mercury Coder 是 Inception Labs 推出的首個(gè)擴(kuò)散型大語言模型(dLLM),是 Mercury 系列中專門用在代碼生成的模型。Mercury Coder基于“從粗到細(xì)”的生成方式...
閱讀原文

SuperGPQA

SuperGPQA 是字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)聯(lián)合 M-A-P 推出的全面覆蓋 285 個(gè)研究生級學(xué)科、包含 26529 道專業(yè)題目的知識(shí)推理基準(zhǔn)測試集。解決傳統(tǒng)評測基準(zhǔn)學(xué)科覆蓋...
閱讀原文

SpeciesNet

SpeciesNet 是 Google 開源的人工智能模型,通過分析相機(jī)陷阱拍攝的照片來識(shí)別動(dòng)物物種。基于超過 6500 萬張圖像訓(xùn)練而成,能識(shí)別超過 2000 種標(biāo)簽,包括動(dòng)物...
閱讀原文

GaussianCity

GaussianCity 是南洋理工大學(xué) S-Lab 團(tuán)隊(duì)推出的高效無邊界3D城市生成框架,基于3D高斯繪制(3D-GS)技術(shù)。引入緊湊的 BEV-Point 表示方法,將場景的顯存(VRA...
閱讀原文
15354555657146