標簽:自然語言理解

Noiz AI

Noiz AI 是 AI 語音克隆與合成工具,專注于為用戶提供高效、個性化的語音解決方案。基于自研的超大語音模型,能在3-10秒內通過簡短錄音克隆出與真人無異的聲...
閱讀原文

MetaStone-L1-7B

MetaStone-L1-7B 是 MetaStone 系列中的輕量級推理模型,專為提升復雜下游任務的性能而設計。在數(shù)學和代碼等核心推理基準測試中達到了并行模型的頂尖水平(SO...
閱讀原文

Gemma 3

Gemma 3 是谷歌最新推出的開源人工智能模型,專為開發(fā)者設計,支持多種設備上的人工智能應用開發(fā)。支持超過 35 種語言,具備分析文本、圖像及短視頻的能力,...
閱讀原文

NEXUS-O

NEXUS-O 是HiThink 研究院、英國帝國理工學院、浙江大學、復旦大學、微軟、Meta AI等機構推出的多模態(tài)AI模型,能實現(xiàn)對語言、音頻和視覺信息的全方位感知與交...
閱讀原文

Platus

Platus 是法律科技初創(chuàng)公司,專注于通過人工智能和無代碼平臺簡化企業(yè)的法律流程。為中小企業(yè)和法律團隊提供高效、自動化的法律基礎設施,支持文件起草、審查...
閱讀原文

Liquid

Liquid是華中科技大學、字節(jié)跳動和香港大學聯(lián)合推出的極簡統(tǒng)一多模態(tài)生成框架。基于VQGAN將圖像編碼為離散的視覺token,與文本token共享同一詞匯空間,讓大型...
閱讀原文

MindLLM

MindLLM 是耶魯大學、達特茅斯學院和劍橋大學聯(lián)合推出的AI模型,能將腦部功能性磁共振成像(fMRI)信號解碼為自然語言文本。MindLLM基于一個主體無關(subjec...
閱讀原文

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型語言模型,是目前規(guī)模最大、性能最強的聊天模型。基于擴展無監(jiān)督學習,提升模式識別、知識廣度和創(chuàng)意生成能力,減少了幻覺...
閱讀原文

Phi-4-Multimodal

Phi-4-Multimodal 是微軟最新推出的多模態(tài)語言模型,擁有 56 億參數(shù),能將語音、視覺和文本處理集成到一個統(tǒng)一架構中。模型在多個基準測試中表現(xiàn)優(yōu)異,在自動...
閱讀原文

LazyLLM

LazyLLM 是開源的低代碼平臺,幫助開發(fā)者快速、低成本地構建多智能體大語言模型應用。通過極簡的開發(fā)流程,支持一鍵式部署和跨平臺操作,降低了 AI 應用開發(fā)...
閱讀原文

BAG

BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大學和騰訊聯(lián)合提出創(chuàng)新的3D可穿戴資產(chǎn)生成技術,通過結合多視圖圖像擴散模型和控制網(wǎng)絡(Contr...
閱讀原文

LangBot

LangBot 是開源的即時聊天機器人平臺,支持多平臺(如 QQ、微信、飛書、Discord 等)和多種大語言模型(如 ChatGPT、DeepSeek、Gemini 等)。LangBot具備多模...
閱讀原文

SANA 1.5

SANA 1.5 是英偉達聯(lián)合MIT、清華、北大等機構推出的新型高效的線性擴散變換器(Linear Diffusion Transformer),用于文本到圖像生成任務。在 SANA 1.0 的基...
閱讀原文

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架開源的 Android 手機應用,支持各類大語言模型(LLM)在手機上離線運行。具備多模態(tài)功能,能實現(xiàn)文本生成文本、圖像生...
閱讀原文

Qwen Chat

Qwen Chat是阿里千問團隊推出的集成多種Qwen AI大模型的Web交互平臺。Qwen Chat具備多模型同臺競技、上傳文檔精準問答、HTML預覽、看圖說話等功能,擁有類似C...
閱讀原文
12346