標簽:個性化推薦

LongLLaVA:多模態(tài)上下文混合架構(gòu)大語言模型的創(chuàng)新應(yīng)用與特點解析

LongLLaVA是多模態(tài)大型語言模型(MLLM),基于混合架構(gòu)結(jié)合Mamba和Transformer模塊,能高效處理大量圖像,特別擅長視頻理解和高分辨率圖像分析。LongLLaVA在...
閱讀原文

Devika AI:智能AI助手助力高效執(zhí)行復雜任務(wù)

Devika AI是印度Stition AI團隊推出的開源AI軟件開發(fā)工具,能理解并執(zhí)行復雜的人類指令,將其分解為步驟,進行研究和信息搜集,最終編寫代碼以實現(xiàn)目標。Devi...
閱讀原文

紅薯智語:自然清新,煥發(fā)肌膚光彩的護膚秘笈

紅薯智語是為小紅書創(chuàng)作者設(shè)計的智能文案生成工具。通過分析上傳的圖片和關(guān)鍵詞,快速生成適配不同風格和場景的文案。用戶可以自定義文案長度,選擇多種文案...
閱讀原文

Kimi 創(chuàng)作空間:一鍵生成個性化音樂視頻的AI創(chuàng)作工具

Kimi創(chuàng)作空間是Kimi最新推出的AI視頻生成工具,用戶可以非常簡單地創(chuàng)作個性化音樂視頻。Kimi創(chuàng)作空間支持12種預(yù)設(shè)風格模板,也支持用戶通過自定義創(chuàng)作來制作...
閱讀原文

SAM 2.1:Meta開源的先進視覺分割模型提升圖像處理精度與效率

SAM 2.1(全稱Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先進視覺分割模型,用于圖像和視頻。基于簡單的Transformer架構(gòu)和流式記憶設(shè)計...
閱讀原文

金舟AI助手:創(chuàng)新設(shè)計與卓越性能的完美結(jié)合提升您的生活品質(zhì)

金舟AI助手是創(chuàng)新的營銷內(nèi)容創(chuàng)作平臺,基于人工智能和大數(shù)據(jù)技術(shù),為創(chuàng)作者、品牌主和營銷服務(wù)公司提供高效的內(nèi)容創(chuàng)作解決方案。平臺能快速生成富有創(chuàng)意和針...
閱讀原文

Mooncake:創(chuàng)新推理架構(gòu)推動大模型智能應(yīng)用的新時代

Mooncake是月之暗面Kimi聯(lián)合清華大學等機構(gòu)共同開源的大模型推理架構(gòu)。采用以KVCache為中心的分布式架構(gòu),通過分離預(yù)填充和解碼集群,充分利用GPU集群中未充...
閱讀原文

QwQ-32B-Preview:超越O1模型的阿里開源AI推理產(chǎn)品實現(xiàn)高效精準的智能決策

QwQ-32B-Preview(QwQ-32B)是阿里巴巴開源的實驗性研究AI模型,以強大的推理能力著稱,尤其在數(shù)學和編程領(lǐng)域表現(xiàn)卓越。QwQ-32B-Preview包含325億參數(shù),能處...
閱讀原文

悅靈犀AI:創(chuàng)新的Stable Diffusion多模態(tài)模型賦能AI繪畫創(chuàng)作平臺

悅靈犀是基于Stable Diffusion多模態(tài)模型的AI繪畫和創(chuàng)作平臺。基于先進的人工智能技術(shù),為用戶提供動漫風格、Mindjourney風格、ControlNet圖片優(yōu)化設(shè)計等多種...
閱讀原文

AI醬:實時多語言對話的二次元風格AI助手

AI醬是二次元風格的AI多語言智能聊天APP,提供了多個二次元萌妹和帥哥形象,用戶可以與這些角色進行面對面的即時對話。應(yīng)用基于語音識別能力和人工智能技術(shù),...
閱讀原文

Illustrious:高質(zhì)量動漫風格圖像生成的創(chuàng)新開源模型

Illustrious是開源的文本到圖像動漫圖像生成模型,是Onoma AI Research推出的。基于優(yōu)化批量大小、dropout控制、訓練圖像分辨率和多級標題等關(guān)鍵方法,實現(xiàn)高...
閱讀原文

SlideChat:智能視覺語言助手助力多模態(tài)交互體驗

SlideChat是上海AI實驗室、廈門大學、華東師范大學等機構(gòu)推出的,首個能理解千兆像素級別全切片圖像的視覺語言助手。SlideChat能生成詳盡的全切片圖像描述,...
閱讀原文

MCP:Anthropic開源模型上下文協(xié)議的核心優(yōu)勢與創(chuàng)新特點

MCP(Model Context Protocol,模型上下文協(xié)議)是一個開放協(xié)議,是Anthropic開源的,能實現(xiàn)大型語言模型(LLM)應(yīng)用與外部數(shù)據(jù)源和工具之間的無縫集成。基于...
閱讀原文

LEOPARD:騰訊AI Lab推出的視覺語言模型賦能多模態(tài)理解與生成

LEOPARD是騰訊AI Lab西雅圖實驗室推出的視覺語言模型,專為理解和處理含有大量文本的多圖像任務(wù)設(shè)計。LEOPARD基于兩個主要技術(shù)創(chuàng)新:一是策劃約一百萬條專門...
閱讀原文

Pangea:多語言多模態(tài)大語言模型的創(chuàng)新特性與應(yīng)用前景

Pangea是卡內(nèi)基梅隆大學團隊推出的多語言多模態(tài)大型語言模型(LLM),能提升全球語言和文化多樣性的覆蓋。模型包含600萬條指令的多樣化數(shù)據(jù)集,支持39種語言...
閱讀原文
1151617181931