AI項(xiàng)目和框架

Bolt3D

Bolt3D 是谷歌研究院、牛津大學(xué) VGG 團(tuán)隊(duì)和谷歌 DeepMind 聯(lián)合推出的新型 3D 場(chǎng)景生成技術(shù),是潛在擴(kuò)散模型,能在單個(gè) GPU 上,僅需不到七秒的時(shí)間,直接從一...
閱讀原文

Qwen2.5-Omni

Qwen2.5-Omni 是阿里開(kāi)源的 Qwen 系列旗艦級(jí)多模態(tài)模型,擁有7B參數(shù),Qwen2.5-Omni具備強(qiáng)大的多模態(tài)感知能力,能處理文本、圖像、音頻和視頻輸入,支持流式文...
閱讀原文

Cosmos-Reason1

Cosmos-Reason1 是 NVIDIA 推出的一系列多模態(tài)大型語(yǔ)言模型,基于物理常識(shí)和具身推理理解物理世界。Cosmos-Reason1包括兩個(gè)模型:Cosmos-Reason1-8B 和 Cosmo...
閱讀原文

Video-T1

Video-T1 是清華大學(xué)和騰訊的研究人員共同推出的視頻生成技術(shù),基于測(cè)試時(shí)擴(kuò)展(Test-Time Scaling,TTS)提升視頻生成的質(zhì)量和一致性。傳統(tǒng)視頻生成模型在訓(xùn)...
閱讀原文

Oliva

Oliva 是開(kāi)源的語(yǔ)音RAG助手,結(jié)合 Langchain 和 Superlinked 技術(shù),基于語(yǔ)音驅(qū)動(dòng)的 RAG(檢索增強(qiáng)生成)架構(gòu),幫助用戶(hù)在 Qdrant 向量數(shù)據(jù)庫(kù)中實(shí)時(shí)搜索信息。...
閱讀原文

Mureka O1

Mureka O1是昆侖萬(wàn)維發(fā)布的全球首款音樂(lè)推理大模型,全球首個(gè)引入“思維鏈”(Chain of Thought,CoT)技術(shù)的音樂(lè)模型,Mureka O1在推理過(guò)程中加入思考與自我批...
閱讀原文

Mureka V6

Mureka V6是昆侖萬(wàn)維推出的AI音樂(lè)創(chuàng)作平臺(tái)的基座模型,支持純音樂(lè)生成以及10種語(yǔ)言的AI音樂(lè)創(chuàng)作。引入自研的ICL(in-context learning)技術(shù),使聲場(chǎng)更加開(kāi)闊...
閱讀原文

pdf-craft

pdf-craft 是用在將 PDF 文件轉(zhuǎn)換為其他格式(如 Markdown、EPUB)的工具,專(zhuān)注于處理掃描書(shū)籍的 PDF 文件。pdf-craft 支持提取正文內(nèi)容,過(guò)濾掉頁(yè)眉、頁(yè)腳、...
閱讀原文

TaoAvatar

TaoAvatar是阿里巴巴集團(tuán)研究團(tuán)隊(duì)推出的高保真、輕量級(jí)的3D全身對(duì)話(huà)虛擬人技術(shù)。基于3D高斯濺射技術(shù),能生成照片級(jí)逼真的3D全身虛擬形象,支持高分辨率渲染且...
閱讀原文

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個(gè)“思考模型”,能在回應(yīng)前進(jìn)行推理,提升性能和準(zhǔn)確性。模型在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)卓越,在推理和代碼生成方面...
閱讀原文

ReasonGraph

ReasonGraph 是用在可視化和分析大語(yǔ)言模型(LLMs)推理過(guò)程的開(kāi)源網(wǎng)絡(luò)平臺(tái)。ReasonGraph支持超過(guò) 50 種主流模型(如 Anthropic、OpenAI、Google 等),涵蓋...
閱讀原文

AndroidGen

AndroidGen 是智譜技術(shù)團(tuán)隊(duì)推出增強(qiáng)基于大語(yǔ)言模型(LLM)的 Agent 能力的框架,特別是在數(shù)據(jù)稀缺的情況下。框架通過(guò)收集人類(lèi)任務(wù)軌跡基于這些軌跡訓(xùn)練語(yǔ)言模...
閱讀原文

Qwen2.5-VL-32B

Qwen2.5-VL-32B是阿里巴巴開(kāi)源的多模態(tài)模型,參數(shù)規(guī)模為32B。模型在Qwen2.5-VL系列的基礎(chǔ)上,基于強(qiáng)化學(xué)習(xí)優(yōu)化,具備更符合人類(lèi)偏好的回答風(fēng)格、顯著提升的數(shù)...
閱讀原文

瀚海智語(yǔ)

瀚海智語(yǔ)(OceanDS)是國(guó)家海洋環(huán)境預(yù)報(bào)中心聯(lián)合海洋出版社和三六零數(shù)字安全科技共同推出的國(guó)內(nèi)首個(gè)海洋垂直領(lǐng)域大語(yǔ)言模型,模型以360智腦13B和Deepseek-R1-...
閱讀原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通義實(shí)驗(yàn)室推出的從單張圖像重建可動(dòng)畫(huà)化3D人體模型。基于多模態(tài)Transformer架構(gòu),融合3D幾何...
14647484950146