標(biāo)簽:多語(yǔ)言支持

Hika

Hika是國(guó)內(nèi)五人團(tuán)隊(duì)開(kāi)發(fā)的免費(fèi)AI知識(shí)搜索工具,通過(guò)個(gè)性化交互和多維度知識(shí)探索,幫助用戶獲得更全面和深入的搜索結(jié)果。與傳統(tǒng)AI搜索工具不同,不追求“一步到...
閱讀原文

MILS

MILS(Multimodal Iterative LLM Solver)是Meta AI提出的無(wú)需訓(xùn)練即可賦予大型語(yǔ)言模型(LLM)多模態(tài)能力的方法。通過(guò)多步推理,提示LLM生成候選輸出,對(duì)每...
閱讀原文

Granola

Granola是專(zhuān)為頻繁參加會(huì)議的人設(shè)計(jì)的AI會(huì)議助手工具。能實(shí)時(shí)轉(zhuǎn)錄會(huì)議內(nèi)容,自動(dòng)識(shí)別發(fā)言者并標(biāo)注時(shí)間戳,支持用戶在會(huì)議中實(shí)時(shí)添加筆記和標(biāo)記重點(diǎn)。會(huì)議結(jié)束...
閱讀原文

X-Prompt

X-Prompt是用于多模態(tài)視頻目標(biāo)分割的通用框架,解決傳統(tǒng)方法在極端光照、快速運(yùn)動(dòng)和背景干擾等復(fù)雜場(chǎng)景下的局限性。通過(guò)預(yù)訓(xùn)練一個(gè)基于 RGB 數(shù)據(jù)的視頻目標(biāo)分...
閱讀原文

BitsAI-CR

BitsAI-CR是字節(jié)跳動(dòng)團(tuán)隊(duì)推出的基于大型語(yǔ)言模型(LLM)的自動(dòng)化代碼審查工具,通過(guò)兩階段處理流程實(shí)現(xiàn)高效代碼審查:RuleChecker 負(fù)責(zé)基于 219 條規(guī)則檢測(cè)潛...
閱讀原文

Pipecat

Pipecat是開(kāi)源的Python框架,專(zhuān)注于構(gòu)建語(yǔ)音和多模態(tài)對(duì)話代理?;趦?nèi)置的語(yǔ)音識(shí)別、文本轉(zhuǎn)語(yǔ)音(TTS)和對(duì)話處理功能,簡(jiǎn)化AI服務(wù)的復(fù)雜協(xié)調(diào)、網(wǎng)絡(luò)傳輸、音...
閱讀原文

GLM-Realtime

GLM-Realtime是智譜推出的全新端到端多模態(tài)模型,具備低延遲的視頻理解與語(yǔ)音交互能力,特別融入清唱功能,讓大模型在對(duì)話中能展現(xiàn)歌唱才能。模型支持長(zhǎng)達(dá)2分...
閱讀原文

Aibiye

Aibiye是AI論文寫(xiě)作輔助平臺(tái),基于Multimodal+Global Thought Chain語(yǔ)言模型,為用戶提供從開(kāi)題報(bào)告到完整論文的生成服務(wù)。用戶只需輸入關(guān)鍵詞、選擇專(zhuān)業(yè)和字...
閱讀原文

LlamaV-o1

LlamaV-o1是阿聯(lián)酋穆罕默德·本·扎耶德人工智能大學(xué)等機(jī)構(gòu)提出的新多模態(tài)視覺(jué)推理模型,旨在提升大型語(yǔ)言模型的逐步視覺(jué)推理能力。引入視覺(jué)推理鏈基準(zhǔn)測(cè)試VRC-...
閱讀原文

Kokoro-TTS

Kokoro-TTS 是 hexgrad 開(kāi)發(fā)的輕量級(jí)文本轉(zhuǎn)語(yǔ)音(TTS)模型,具有 8200 萬(wàn)參數(shù)。基于 StyleTTS 2 和 ISTFTNet 的混合架構(gòu),采用純解碼器設(shè)計(jì),不使用擴(kuò)散模型...
閱讀原文

訊飛星火 X1

訊飛星火 X1 是科大訊飛于2025年1月15日發(fā)布的國(guó)內(nèi)首個(gè)基于全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練的具備深度思考和推理能力的大模型。在解題過(guò)程中更接近人類(lèi)的“慢思考”方式,僅...
閱讀原文

星火語(yǔ)音同傳大模型

星火語(yǔ)音同傳大模型是科大訊飛于2025年1月15日發(fā)布的國(guó)內(nèi)首個(gè)具備端到端語(yǔ)音同傳能力的大模型。模型在內(nèi)容完整度、信息準(zhǔn)確度以及語(yǔ)言質(zhì)量上均處于行業(yè)領(lǐng)先水...
閱讀原文

Eko

Eko是Fellou AI推出的生產(chǎn)就緒型JavaScript框架,基于自然語(yǔ)言驅(qū)動(dòng)的方式,幫助開(kāi)發(fā)者輕松創(chuàng)建從簡(jiǎn)單指令到復(fù)雜流程的可靠智能代理。Eko支持所有平臺(tái),包括計(jì)...
閱讀原文

Banger

Banger是以AI翻唱為核心的AI音樂(lè)應(yīng)用,用戶能通過(guò)簡(jiǎn)單的步驟將喜歡的歌曲進(jìn)行翻唱?jiǎng)?chuàng)作。應(yīng)用內(nèi)置了大量素材模板,引入個(gè)性化算法推薦功能,支持從YouTube提取...
閱讀原文

碼上飛

碼上飛(CodeFlying)是無(wú)需編程基礎(chǔ)的AI智能軟件開(kāi)發(fā)平臺(tái)。用戶只需用自然語(yǔ)言描述需求,AI能自動(dòng)生成端到端的應(yīng)用程序,從需求分析到代碼生成、測(cè)試、部署...
閱讀原文
1202122232462