標簽:自然語言理解

Gemma 3

Gemma 3 是谷歌最新推出的開源人工智能模型,專為開發者設計,支持多種設備上的人工智能應用開發。支持超過 35 種語言,具備分析文本、圖像及短視頻的能力,...
閱讀原文

NEXUS-O

NEXUS-O 是HiThink 研究院、英國帝國理工學院、浙江大學、復旦大學、微軟、Meta AI等機構推出的多模態AI模型,能實現對語言、音頻和視覺信息的全方位感知與交...
閱讀原文

Platus

Platus 是法律科技初創公司,專注于通過人工智能和無代碼平臺簡化企業的法律流程。為中小企業和法律團隊提供高效、自動化的法律基礎設施,支持文件起草、審查...
閱讀原文

Liquid

Liquid是華中科技大學、字節跳動和香港大學聯合推出的極簡統一多模態生成框架。基于VQGAN將圖像編碼為離散的視覺token,與文本token共享同一詞匯空間,讓大型...
閱讀原文

MindLLM

MindLLM 是耶魯大學、達特茅斯學院和劍橋大學聯合推出的AI模型,能將腦部功能性磁共振成像(fMRI)信號解碼為自然語言文本。MindLLM基于一個主體無關(subjec...
閱讀原文

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型語言模型,是目前規模最大、性能最強的聊天模型。基于擴展無監督學習,提升模式識別、知識廣度和創意生成能力,減少了幻覺...
閱讀原文

Phi-4-Multimodal

Phi-4-Multimodal 是微軟最新推出的多模態語言模型,擁有 56 億參數,能將語音、視覺和文本處理集成到一個統一架構中。模型在多個基準測試中表現優異,在自動...
閱讀原文

LazyLLM

LazyLLM 是開源的低代碼平臺,幫助開發者快速、低成本地構建多智能體大語言模型應用。通過極簡的開發流程,支持一鍵式部署和跨平臺操作,降低了 AI 應用開發...
閱讀原文

BAG

BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大學和騰訊聯合提出創新的3D可穿戴資產生成技術,通過結合多視圖圖像擴散模型和控制網絡(Contr...
閱讀原文

LangBot

LangBot 是開源的即時聊天機器人平臺,支持多平臺(如 QQ、微信、飛書、Discord 等)和多種大語言模型(如 ChatGPT、DeepSeek、Gemini 等)。LangBot具備多模...
閱讀原文

SANA 1.5

SANA 1.5 是英偉達聯合MIT、清華、北大等機構推出的新型高效的線性擴散變換器(Linear Diffusion Transformer),用于文本到圖像生成任務。在 SANA 1.0 的基...
閱讀原文

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架開源的 Android 手機應用,支持各類大語言模型(LLM)在手機上離線運行。具備多模態功能,能實現文本生成文本、圖像生...
閱讀原文

Qwen Chat

Qwen Chat是阿里千問團隊推出的集成多種Qwen AI大模型的Web交互平臺。Qwen Chat具備多模型同臺競技、上傳文檔精準問答、HTML預覽、看圖說話等功能,擁有類似C...
閱讀原文

MiniPerplx

MiniPerplx 是開源的 AI 搜索引擎,基于 Grok 2.0 模型進行搜索。MiniPerplx提供了免費的替代方案,用在搜索網頁、推特帖子、研究論文和 YouTube 視頻等內容...
閱讀原文

SPRIGHT

SPRIGHT(SPatially RIGHT)是亞利桑那州立大學 、Intel 實驗室 、Hugging Face 、華盛頓大學等機構聯合推出的,專注于空間關系的大型視覺-語言數據集,能解...
閱讀原文
12346