標(biāo)簽:多語(yǔ)言支持

ViDoRAG

ViDoRAG是阿里巴巴通義實(shí)驗(yàn)室聯(lián)合中國(guó)科學(xué)技術(shù)大學(xué)和上海交通大學(xué)推出的視覺(jué)文檔檢索增強(qiáng)生成框架。基于多智能體協(xié)作和動(dòng)態(tài)迭代推理,解決傳統(tǒng)方法在處理復(fù)雜...
閱讀原文

Shandu

Shandu 是開源的 AI 研究自動(dòng)化工具,結(jié)合了 LangChain 和 LangGraph 技術(shù),能自動(dòng)化地進(jìn)行多層次信息挖掘和分析,生成結(jié)構(gòu)化的研究報(bào)告。Shandu 的核心功能...
閱讀原文

Mochii AI

Mochii AI 是多功能的智能AI助手,通過(guò)先進(jìn)的人工智能技術(shù)提升用戶的生產(chǎn)力和創(chuàng)造力。支持多種高級(jí)AI模型,如GPT-4、Claude 3.5和Gemini,能提供智能對(duì)話、語(yǔ)...
閱讀原文

WhisperChain

WhisperChain 是開源的語(yǔ)音識(shí)別工具,基于語(yǔ)音輸入提升工作效率。WhisperChain用 Whisper.cpp 實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音識(shí)別,將語(yǔ)音轉(zhuǎn)換為文本,基于 LangChain 對(duì)文本進(jìn)...
閱讀原文

T2V-01-Director

T2V-01-Director 是海螺AI(MiniMax)推出的文本到視頻生成工具,專注于通過(guò)自然語(yǔ)言指令實(shí)現(xiàn)精準(zhǔn)的鏡頭運(yùn)動(dòng)控制。支持用戶在生成視頻時(shí),通過(guò)簡(jiǎn)單的文字描述...

Mahilo

Mahilo 是靈活的多智能體框架,支持創(chuàng)建與人類互動(dòng)的多智能體系統(tǒng)。Mahilo支持實(shí)時(shí)語(yǔ)音和文本通信,智能體之間能自主共享上下文和信息,保持人類對(duì)交互的監(jiān)督...
閱讀原文

Mobius

Mobius 是先進(jìn)的無(wú)縫循環(huán)視頻生成技術(shù),能通過(guò)人工智能算法從文本描述生成無(wú)限循環(huán)的視頻內(nèi)容。核心在于強(qiáng)大的AI模型,能自動(dòng)識(shí)別視頻中的關(guān)鍵元素并生成平滑...
閱讀原文

HippoRAG 2

HippoRAG 2是俄亥俄州立大學(xué)推出的檢索增強(qiáng)生成(RAG)框架,解決現(xiàn)有RAG系統(tǒng)在模擬人類長(zhǎng)期記憶動(dòng)態(tài)性和關(guān)聯(lián)性方面的局限性。HippoRAG 2基于個(gè)性化PageRank...
閱讀原文

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音頻大語(yǔ)言模型,支持無(wú)縫集成音頻理解和生成功能,實(shí)現(xiàn)支持高質(zhì)量、可控的實(shí)時(shí)中英雙語(yǔ)對(duì)話。Baichuan-Audio基于多碼...
閱讀原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升級(jí)版 AI 視頻生成工具,基于深度學(xué)習(xí)技術(shù),能將圖片或文字提示轉(zhuǎn)化為高質(zhì)量的視頻內(nèi)容。與前代版本相比,Pika 2.2 在功能和性...
閱讀原文

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型語(yǔ)言模型,是目前規(guī)模最大、性能最強(qiáng)的聊天模型。基于擴(kuò)展無(wú)監(jiān)督學(xué)習(xí),提升模式識(shí)別、知識(shí)廣度和創(chuàng)意生成能力,減少了幻覺(jué)...
閱讀原文

3FS

3FS(Fire-Flyer File System)是DeepSeek推出的高性能分布式文件系統(tǒng),專為AI訓(xùn)練和推理任務(wù)設(shè)計(jì)。3FS用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)技術(shù),基于分離式架構(gòu)聚合數(shù)千個(gè)SS...
閱讀原文

R1-Onevision

R1-Onevision 是開源的多模態(tài)大語(yǔ)言模型,專注于復(fù)雜視覺(jué)推理任務(wù)。基于 Qwen2.5-VL 微調(diào)而成,通過(guò)整合視覺(jué)和文本數(shù)據(jù),能精準(zhǔn)地進(jìn)行多模態(tài)信息解釋。在數(shù)學(xué)...
閱讀原文

Phi-4-Mini

Phi-4-Mini 是微軟 Phi-4 系列中最新推出的專注于文本任務(wù)的小型語(yǔ)言模型,參數(shù)量為 38 億。基于密集的解碼器-only Transformer 架構(gòu),結(jié)合分組查詢注意力(G...
閱讀原文

IndexTTS

IndexTTS 是 B 站推出的工業(yè)級(jí)可控文本轉(zhuǎn)語(yǔ)音(TTS)系統(tǒng)。基于 XTTS 和 Tortoise 模型開發(fā),結(jié)合了 GPT 風(fēng)格的生成技術(shù),能將文本高效轉(zhuǎn)化為自然流暢的語(yǔ)音...
閱讀原文
1141516171861