AI項(xiàng)目和框架

OmniSQL

OmniSQL 是開(kāi)源的文本到 SQL 模型,將自然語(yǔ)言問(wèn)題高效轉(zhuǎn)換為 SQL 查詢語(yǔ)句。通過(guò)創(chuàng)新的數(shù)據(jù)合成框架生成了首個(gè)百萬(wàn)量級(jí)的文本到 SQL 數(shù)據(jù)集 SynSQL-2.5M,包...
閱讀原文

RoboOS

RoboOS是智源研究院推出的首個(gè)跨本體具身大小腦協(xié)作框架。基于“大腦-小腦”分層架構(gòu),具身大腦RoboBrain負(fù)責(zé)全局感知與決策,小腦技能庫(kù)負(fù)責(zé)低延遲精準(zhǔn)執(zhí)行,...
閱讀原文

Vidu Q1

Vidu Q1 是清華大學(xué)人工智能研究院副院長(zhǎng)、生數(shù)科技創(chuàng)始人兼首席科學(xué)家朱軍教授團(tuán)隊(duì)推出的高可控視頻大模型。在多主體細(xì)節(jié)可控、音效同步可控、畫(huà)質(zhì)增強(qiáng)等方...
閱讀原文

PaddleSpeech

PaddleSpeech 是百度飛槳團(tuán)隊(duì)開(kāi)源的語(yǔ)音處理工具,提供全面的語(yǔ)音處理功能,包括語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、語(yǔ)音翻譯等。PaddleSpeech提供命令行界面、服...
閱讀原文

ChatAnyone

ChatAnyone是阿里巴巴通義實(shí)驗(yàn)室推出的實(shí)時(shí)風(fēng)格化肖像視頻生成框架。通過(guò)音頻輸入,生成具有豐富表情和上半身動(dòng)作的肖像視頻。采用高效分層運(yùn)動(dòng)擴(kuò)散模型和混...
閱讀原文

Math24o

Math24o 是中文大模型測(cè)評(píng)基準(zhǔn) SuperCLUE 開(kāi)源的高中奧林匹克數(shù)學(xué)競(jìng)賽級(jí)別的數(shù)學(xué)推理測(cè)評(píng)基準(zhǔn)。主要用于評(píng)估大型語(yǔ)言模型在數(shù)學(xué)推理方面的能力。使用2024年全...
閱讀原文

TripoSG

TripoSG 是 VAST-AI-Research 團(tuán)隊(duì)推出的基于大規(guī)模修正流(Rectified Flow, RF)模型的高保真 3D 形狀合成技術(shù), 通過(guò)大規(guī)模修正流變換器架構(gòu)、混合監(jiān)督訓(xùn)練...
閱讀原文

TripoSF

TripoSF是VAST推出的新一代3D基礎(chǔ)模型,突破傳統(tǒng)3D建模在細(xì)節(jié)、復(fù)雜結(jié)構(gòu)和擴(kuò)展性上的瓶頸。采用SparseFlex表示方法,結(jié)合稀疏體素結(jié)構(gòu),僅在物體表面附近的區(qū)...
閱讀原文

DistilQwen2.5-R1

DistilQwen2.5-R1 是阿里巴巴推出的基于知識(shí)蒸餾技術(shù)的小型化系列深度推理模型,包含3B、7B、14B和32B四個(gè)參數(shù)量級(jí)的模型。DistilQwen2.5-R1將超大規(guī)模模型(...
閱讀原文

TxGemma

TxGemma 是谷歌推出的用于藥物發(fā)現(xiàn)的通用人工智能模型,通過(guò) AI 技術(shù)加速藥物研發(fā)進(jìn)程。基于 Google 的 Gemma 框架開(kāi)發(fā),能理解常規(guī)文本以及化學(xué)物質(zhì)、分子和...
閱讀原文

QVQ-Max

QVQ-Max 是阿里通義推出的視覺(jué)推理模型,是QVQ-72B-Preview的正式升級(jí)版。QVQ-Max能“看懂”圖片和視頻內(nèi)容,結(jié)合信息進(jìn)行分析、推理和解決問(wèn)題。QVQ-Max支持應(yīng)...
閱讀原文

ModelEngine

ModelEngine 是華為開(kāi)源的全流程 AI 開(kāi)發(fā)工具鏈,圍繞數(shù)據(jù)使能、模型使能和應(yīng)用使能三大核心功能展開(kāi),解決 AI 行業(yè)化落地過(guò)程中數(shù)據(jù)工程耗時(shí)長(zhǎng)、模型訓(xùn)練和...
閱讀原文

Ideogram 3.0

Ideogram 3.0 是Ideogram推出的 AI 圖像生成模型。Ideogram 3.0在圖像生成質(zhì)量上實(shí)現(xiàn)飛躍,具備高度的真實(shí)感、出色的文本渲染和強(qiáng)大的語(yǔ)言理解能力,支持生成...
閱讀原文

Piece it Together

Piece it Together (PiT)是Bria AI等機(jī)構(gòu)推出的創(chuàng)新圖像生成框架,專門用在從部分視覺(jué)組件生成完整的概念圖像。基于特定領(lǐng)域的先驗(yàn)知識(shí),將用戶提供的碎片...
閱讀原文

RF-DETR

RF-DETR是Roboflow推出的實(shí)時(shí)目標(biāo)檢測(cè)模型。RF-DETR是首個(gè)在COCO數(shù)據(jù)集上達(dá)到60+平均精度均值(mAP)的實(shí)時(shí)模型,性能優(yōu)于現(xiàn)有的目標(biāo)檢測(cè)模型。RF-DETR結(jié)合LW...
閱讀原文
14546474849146