標(biāo)簽:多模態(tài)交互

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來(lái)日常寫(xiě)作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址:http:/...
閱讀原文

AI賺錢(qián)副業(yè)~AI生成影視解說(shuō),半個(gè)月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說(shuō)的是,機(jī)會(huì)還是有的,但問(wèn)題不在于有沒(méi)有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過(guò)很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...

DreamVVT

DreamVVT 是字節(jié)跳動(dòng)和清華大學(xué)(深圳)聯(lián)合推出的視頻虛擬試穿(Video Virtual Try-On, VVT)技術(shù),基于擴(kuò)散 Transformer(DiTs)框架,通過(guò)兩階段方法實(shí)現(xiàn)...
閱讀原文

dots.vlm1

dots.vlm1 是小紅書(shū) hi lab 開(kāi)源的首個(gè)多模態(tài)大模型。基于一個(gè)從零訓(xùn)練的 12 億參數(shù)視覺(jué)編碼器 NaViT 和 DeepSeek V3 大語(yǔ)言模型(LLM),具備強(qiáng)大的視覺(jué)感知...
閱讀原文

Claude Opus 4.1

Claude Opus 4.1 是 Anthropic 公司最新推出的大型語(yǔ)言模型,是 Claude Opus 4 的升級(jí)版本。模型在多個(gè)方面進(jìn)行優(yōu)化和提升,包括推理質(zhì)量、指令遵循能力及整...
閱讀原文

Intern-S1

Intern-S1是上海人工智能實(shí)驗(yàn)室在世界人工智能大會(huì)上正式開(kāi)源發(fā)布的科學(xué)多模態(tài)大模型,融合了語(yǔ)言和多模態(tài)性能,具備高水平的均衡發(fā)展能力,并富集多學(xué)科專業(yè)...
閱讀原文

Pic Answer

Pic Answer 是 Tech Consolidated Inc. 推出的智能教育應(yīng)用,通過(guò)拍照快速解答學(xué)術(shù)問(wèn)題。用戶只需拍攝題目或問(wèn)題的照片,應(yīng)用會(huì)借助先進(jìn)的人工智能技術(shù),迅速...
閱讀原文

TRAE Agent

TRAE Agent 是字節(jié)跳動(dòng)開(kāi)源的基于大語(yǔ)言模型(LLM)的智能助手,專為軟件工程任務(wù)設(shè)計(jì)。能像資深工程師一樣自主完成復(fù)雜任務(wù),例如復(fù)現(xiàn)問(wèn)題、制定修復(fù)方案、...
閱讀原文

DeepAgent

DeepAgent是Abacus.AI推出的全能通用Agent,專為企業(yè)和專業(yè)人士設(shè)計(jì),支持基于自然語(yǔ)言輸入快速生成風(fēng)險(xiǎn)投資(VC)融資演示文稿,DeepAgent能進(jìn)行跨學(xué)科研究...
閱讀原文

星流Agent

星流Agent是專為中文用戶設(shè)計(jì)的一站式創(chuàng)意設(shè)計(jì)Agent。星流Agent延續(xù)Lovart的全棧式智能設(shè)計(jì)能力,全面適配中文語(yǔ)義、東方美學(xué)和本地場(chǎng)景。用戶只需輸入一句話...
閱讀原文

OAgents

OAgents 是OPPO PersonalAI Lab推出的開(kāi)源基礎(chǔ)Agent框架。框架基于標(biāo)準(zhǔn)化的評(píng)估協(xié)議和模塊化設(shè)計(jì),推動(dòng)Agent框架的研究。OAgents基于系統(tǒng)實(shí)證研究,分析關(guān)鍵A...
閱讀原文

鴻蒙智能體框架(HMAF)是什么?一文看懂

鴻蒙智能體框架(Harmony Agent Framework,簡(jiǎn)稱 HMAF)是華為公司為其自主研發(fā)的鴻蒙操作系統(tǒng)(HarmonyOS)打造的一款核心人工智能框架 。在于構(gòu)建一個(gè)具備...
閱讀原文

AI智能體(AI Agent)是什么?一文看懂

AI智能體(AI Agent),也被稱為人工智能體,是人工智能領(lǐng)域中的一個(gè)核心概念,指的是能感知其環(huán)境、進(jìn)行自主決策并采取行動(dòng)以實(shí)現(xiàn)特定目標(biāo)的智能實(shí)體或計(jì)算...
閱讀原文

Kimi-Dev

Kimi-Dev是Moonshot AI推出的開(kāi)源代碼模型,專為軟件工程任務(wù)設(shè)計(jì)。模型擁有 72B 參數(shù)量,編程水平比最新的DeepSeek-R1還強(qiáng),和閉源模型比較也表現(xiàn)優(yōu)異。在 S...
閱讀原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級(jí)版多模態(tài)AI模型,具體版本號(hào)為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文

Embodied Reasoner

Embodied Reasoner是浙江大學(xué)、中國(guó)科學(xué)院軟件研究所、阿里巴巴集團(tuán)等機(jī)構(gòu)推出的新型的具身交互推理模型,基于視覺(jué)搜索、推理和行動(dòng)協(xié)同完成復(fù)雜任務(wù)。模型基...
閱讀原文

訊飛星辰MaaS

訊飛星辰MaaS是科大訊飛推出的AI大模型定制微調(diào)平臺(tái),創(chuàng)建你的專屬定制大模型。訊飛星辰MaaS匯集20多個(gè)行業(yè)內(nèi)知名的優(yōu)質(zhì)模型,如星火大模型、Llama3、DeepSee...
閱讀原文
123