標(biāo)簽:自然語(yǔ)言處理

LTXV-13B

LTXV-13B 是Lightricks推出的開(kāi)源 AI 視頻生成模型,擁有 130 億參數(shù)。具備極高的生成速度,比同類產(chǎn)品快 30 倍,能在普通消費(fèi)級(jí)顯卡(如 4090/5090)上運(yùn)行...
閱讀原文

Mogao

Mogao是字節(jié)跳動(dòng)Seed團(tuán)隊(duì)推出的交錯(cuò)多模態(tài)生成全基礎(chǔ)模型。在架構(gòu)上采用了雙視覺(jué)編碼器,結(jié)合變分自編碼器(VAE)和視覺(jué)變換器(ViT),能更好地進(jìn)行視覺(jué)理解...
閱讀原文

FlowGram.AI

FlowGram 是字節(jié)跳動(dòng)開(kāi)源的基于節(jié)點(diǎn)編輯的前端流程搭建引擎,幫助開(kāi)發(fā)者快速構(gòu)建固定布局或自由連線布局的工作流。支持兩種布局模式:固定布局適合順序工作流...
閱讀原文

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是英偉達(dá)推出的開(kāi)源自動(dòng)語(yǔ)音識(shí)別(ASR)模型。采用FastConformer編碼器和TDT解碼器架構(gòu),通過(guò)預(yù)測(cè)文本標(biāo)記及其持續(xù)時(shí)間加速推理,減少計(jì)算...
閱讀原文

Avatar IV

Avatar IV 是 HeyGen 推出的數(shù)字人模型,用在快速創(chuàng)建逼真視頻。用戶只需上傳一張照片和一段腳本或音頻,能生成自然流暢的視頻。模型基于音頻驅(qū)動(dòng)的表情引擎...
閱讀原文

oli

oli 是開(kāi)源的智能代碼助手,支持為開(kāi)發(fā)者提供強(qiáng)大的編程支持。基于現(xiàn)代化的混合架構(gòu),結(jié)合 Rust 后端的高性能和 React/Ink 前端的交互式終端界面。oli 支持多...
閱讀原文

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的多模態(tài)語(yǔ)言模型。模型在性能和成本之間實(shí)現(xiàn)平衡,接近甚至達(dá)到Claude Sonnet 3.7模型的性能水平,成本僅為后者的1/8(每...
閱讀原文

Ztalk.ai

Ztalk.ai 是AI桌面應(yīng)用程序,專注于實(shí)時(shí)語(yǔ)音翻譯。支持超過(guò)30種語(yǔ)言,延遲小于100毫秒,能與Zoom、Google Meet、Teams等主流視頻會(huì)議工具無(wú)縫集成。
閱讀原文

Open Computer Agent

Open Computer Agent 是 Hugging Face 推出的免費(fèi)云端 AI Agent 工具。支持在 Linux 虛擬機(jī)中運(yùn)行,基于預(yù)裝的程序(如 Firefox)完成用戶指定的任務(wù),例如用...
閱讀原文

Absolute Zero

Absolute Zero是清華大學(xué) LeapLab 團(tuán)隊(duì)聯(lián)合北京通用人工智能研究院 NLCo 實(shí)驗(yàn)室和賓夕法尼亞州立大學(xué)推出的全新語(yǔ)言模型推理訓(xùn)練方法。Absolute Zero基于模型...
閱讀原文

FlexiAct

FlexiAct是清華大學(xué)和騰訊ARC實(shí)驗(yàn)室聯(lián)合推出的新型動(dòng)作遷移模型。FlexiAct能在給定目標(biāo)圖像的情況下,將參考視頻中的動(dòng)作遷移到目標(biāo)主體上,在空間結(jié)構(gòu)差異較...
閱讀原文

mrge

mrge 是高效智能的 AI 代碼審查平臺(tái),專為提升開(kāi)發(fā)團(tuán)隊(duì)的代碼質(zhì)量和審查效率設(shè)計(jì)。通過(guò) AI 自動(dòng)審核代碼,快速發(fā)現(xiàn)潛在缺陷、安全漏洞和性能問(wèn)題,顯著節(jié)省開(kāi)...
閱讀原文

Klavis AI

Klavis AI 是一個(gè)開(kāi)源的 MCP(Multimodal Communication Protocol,多模態(tài)通信協(xié)議)集成平臺(tái),幫助 AI 應(yīng)用快速接入生產(chǎn)級(jí)的 MCP 服務(wù)器和客戶端。平臺(tái)提供...
閱讀原文

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 語(yǔ)言模型家族中最小的模型的預(yù)覽版本。Granite 4.0 Tiny Preview用極高的計(jì)算效率和緊湊的模型結(jié)構(gòu)為特...
閱讀原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級(jí)版多模態(tài)AI模型,具體版本號(hào)為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文
14567867