AI項(xiàng)目和框架

Step1X-3D

Step1X-3D 是StepFun聯(lián)合LightIllusions推出的高保真、可控的 3D 資產(chǎn)生成框架。基于嚴(yán)格的數(shù)據(jù)整理流程,從超過(guò) 500 萬(wàn)個(gè) 3D 資產(chǎn)中篩選出 200 萬(wàn)個(gè)高質(zhì)量數(shù)...
閱讀原文

Seedance 1.0 lite

Seedance 1.0 lite是火山引擎推出的豆包視頻生成模型的小參數(shù)量版本,支持文生視頻和圖生視頻兩種生成方式,支持生成5秒或10秒、480p或720p分辨率的視頻。
閱讀原文

MCPHub

MCPHub是一站式MCP(模型上下文協(xié)議)服務(wù)器聚合平臺(tái)。支持將多個(gè)MCP服務(wù)器整合到不同的流式HTTP(SSE)端點(diǎn),基于直觀(guān)的Web界面和強(qiáng)大的協(xié)議處理能力,簡(jiǎn)化A...
閱讀原文

Co-Sight

Co-Sight是中興通訊開(kāi)源的超級(jí)智能體項(xiàng)目,為協(xié)同視覺(jué)分析平臺(tái)及智能自動(dòng)化底座。采用多智能體架構(gòu),構(gòu)建“數(shù)字團(tuán)隊(duì)”協(xié)同體系,通過(guò)DAG任務(wù)引擎驅(qū)動(dòng),實(shí)現(xiàn)任務(wù)...
閱讀原文

HealthBench

HealthBench是OpenAI推出的醫(yī)療開(kāi)源測(cè)試基準(zhǔn),用在評(píng)估大型語(yǔ)言模型(LLMs)在醫(yī)療保健領(lǐng)域的表現(xiàn)和安全性。HealthBench包含5000個(gè)模型與用戶(hù)或醫(yī)療專(zhuān)業(yè)人員...
閱讀原文

Chinese-LiPS

Chinese-LiPS 是智源研究院聯(lián)合南開(kāi)大學(xué)共同打造的高質(zhì)量中文多模態(tài)語(yǔ)音識(shí)別數(shù)據(jù)集,包含100小時(shí)的語(yǔ)音、視頻和手動(dòng)轉(zhuǎn)錄文本,創(chuàng)新性地融合了唇讀視頻和演講...
閱讀原文

ViLAMP

ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是螞蟻集團(tuán)和中國(guó)人民大學(xué)聯(lián)合推出的視覺(jué)語(yǔ)言模型,專(zhuān)門(mén)用在高效處理長(zhǎng)視頻內(nèi)容。基于混合精度策略,對(duì)...
閱讀原文

Seed1.5-VL

Seed1.5-VL 是字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)最新發(fā)布的視覺(jué)-語(yǔ)言多模態(tài)大模型,具備強(qiáng)大的通用多模態(tài)理解和推理能力,推理成本顯著降低。模型由一個(gè) 532M 參數(shù)的視覺(jué)編...
閱讀原文

PrimitiveAnything

PrimitiveAnything是騰訊人工智能平臺(tái)部(AIPD)和清華大學(xué)聯(lián)合開(kāi)發(fā)的新型3D形狀生成框架。將復(fù)雜的3D形狀分解為簡(jiǎn)單的基元元素,通過(guò)自回歸方式生成這些基元...
閱讀原文

OptoChat AI

OptoChat AI是南智光電與南京大學(xué)共同推出的國(guó)內(nèi)首款光子專(zhuān)用大模型。模型聚焦光子領(lǐng)域全產(chǎn)業(yè)鏈,集成超過(guò)30萬(wàn)條光子芯片相關(guān)專(zhuān)利、文獻(xiàn)和行業(yè)數(shù)據(jù)資源,具備...
閱讀原文

Xianyu AutoAgent

Xianyu AutoAgent 是為閑魚(yú)平臺(tái)設(shè)計(jì)的智能客服機(jī)器人系統(tǒng)。支持實(shí)現(xiàn)7×24小時(shí)自動(dòng)化值守,多專(zhuān)家協(xié)同決策、智能議價(jià)及上下文感知對(duì)話(huà)。基于上下文感知技術(shù),管...
閱讀原文

Matrix-Game

Matrix-Game是昆侖萬(wàn)維開(kāi)源的工業(yè)界首個(gè)10B+空間智能大模型,是Matrix-Zero世界模型中的可交互視頻生成大模型。模型基于兩階段訓(xùn)練策略,根據(jù)用戶(hù)輸入生成連...
閱讀原文

GitFriend

GitFriend 是基于 React、TypeScript 和 AI 技術(shù)推出的 AI GitHub 輔助工具,能簡(jiǎn)化 GitHub 的使用流程,提升開(kāi)發(fā)效率。GitFriend支持基于 AI 聊天功能為用戶(hù)...
閱讀原文

Muyan-TTS

Muyan-TTS 是為播客場(chǎng)景設(shè)計(jì)的開(kāi)源文本轉(zhuǎn)語(yǔ)音(TTS)模型。模型預(yù)訓(xùn)練超過(guò)10萬(wàn)小時(shí)的播客音頻數(shù)據(jù),能實(shí)現(xiàn)零樣本語(yǔ)音合成,無(wú)需大量目標(biāo)說(shuō)話(huà)人的語(yǔ)音數(shù)據(jù)可生...
閱讀原文

Audio-SDS

Audio-SDS是NVIDIA AI研究團(tuán)隊(duì)推出的創(chuàng)新技術(shù),將Score Distillation Sampling(SDS)技術(shù)擴(kuò)展至文本條件音頻擴(kuò)散模型,為音頻處理領(lǐng)域帶來(lái)了重大突破。無(wú)需...
閱讀原文
14041424344155