標(biāo)簽:智能對話生成

QwQ-32B

QwQ-32B 是阿里巴巴開源的新型推理模型,參數(shù)量為 320 億?;诖笠?guī)模強化學(xué)習(xí)(RL)訓(xùn)練,在數(shù)學(xué)推理、編程等任務(wù)上表現(xiàn)出色,性能比肩 6710 億參數(shù)的 DeepS...
閱讀原文

BGE-VL

BGE-VL 是北京智源研究院聯(lián)合多所高校推出的多模態(tài)向量模型,基于大規(guī)模合成數(shù)據(jù) MegaPairs 訓(xùn)練而成。BGE-VL專注于多模態(tài)檢索任務(wù),如圖文檢索和組合圖像檢...
閱讀原文

MindLLM

MindLLM 是耶魯大學(xué)、達特茅斯學(xué)院和劍橋大學(xué)聯(lián)合推出的AI模型,能將腦部功能性磁共振成像(fMRI)信號解碼為自然語言文本。MindLLM基于一個主體無關(guān)(subjec...
閱讀原文

ARTalk

ARTalk是東京大學(xué)和日本理化學(xué)研究所推出的新型語音驅(qū)動3D頭部動畫生成框架,基于自回歸模型實現(xiàn)實時、高同步性的唇部動作和自然的面部表情及頭部姿勢生成。A...
閱讀原文

Mochii AI

Mochii AI 是多功能的智能AI助手,通過先進的人工智能技術(shù)提升用戶的生產(chǎn)力和創(chuàng)造力。支持多種高級AI模型,如GPT-4、Claude 3.5和Gemini,能提供智能對話、語...
閱讀原文

Mobius

Mobius 是先進的無縫循環(huán)視頻生成技術(shù),能通過人工智能算法從文本描述生成無限循環(huán)的視頻內(nèi)容。核心在于強大的AI模型,能自動識別視頻中的關(guān)鍵元素并生成平滑...
閱讀原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升級版 AI 視頻生成工具,基于深度學(xué)習(xí)技術(shù),能將圖片或文字提示轉(zhuǎn)化為高質(zhì)量的視頻內(nèi)容。與前代版本相比,Pika 2.2 在功能和性...
閱讀原文

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型語言模型,是目前規(guī)模最大、性能最強的聊天模型?;跀U展無監(jiān)督學(xué)習(xí),提升模式識別、知識廣度和創(chuàng)意生成能力,減少了幻覺...
閱讀原文

Phi-4-Mini

Phi-4-Mini 是微軟 Phi-4 系列中最新推出的專注于文本任務(wù)的小型語言模型,參數(shù)量為 38 億。基于密集的解碼器-only Transformer 架構(gòu),結(jié)合分組查詢注意力(G...
閱讀原文

a0.dev

a0.dev 是基于 AI 技術(shù)的開發(fā)平臺,專注于快速生成 React Native 應(yīng)用。a0.dev 基于自然語言輸入,自動生成完整的 React Native 項目代碼,包括前端界面、狀...
閱讀原文

元鏡

元鏡是基于人機共生引擎的AI視頻創(chuàng)作系統(tǒng),支持從創(chuàng)意靈感到成品視頻實現(xiàn)高效創(chuàng)作。元鏡基于自動化腳本生成、角色風(fēng)格統(tǒng)一、多模態(tài)融合和智能工作流等功能,...
閱讀原文

吐司AI LOGO

吐司AI LOGO是吐司TusiArt推出的 AI 插圖 LOGO 圖標(biāo)生成應(yīng)用,用戶可以通過輸入詳細的描述來生成個性化的 LOGO 圖標(biāo)。
閱讀原文

LazyLLM

LazyLLM 是開源的低代碼平臺,幫助開發(fā)者快速、低成本地構(gòu)建多智能體大語言模型應(yīng)用。通過極簡的開發(fā)流程,支持一鍵式部署和跨平臺操作,降低了 AI 應(yīng)用開發(fā)...
閱讀原文

MME-CoT

MME-CoT 是香港中文大學(xué)(深圳)、香港中文大學(xué)、字節(jié)跳動、南京大學(xué)、上海人工智能實驗室、賓夕法尼亞大學(xué)、清華大學(xué)等機構(gòu)共同推出的用于評估大型多模態(tài)模...
閱讀原文

SignLLM

SignLLM 是創(chuàng)新的多語言手語生成模型,通過文字輸入生成對應(yīng)的手語視頻。全球首個支持多國手語的模型,能覆蓋美國手語(ASL)、德國手語(GSL)、阿根廷手語...
閱讀原文
14567820