標簽:多模態理解

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Qwen3-Omni

Qwen3-Omni是阿里通義團隊推出的業界首個原生端到端全模態AI模型,能無縫處理文本、圖像、音頻和視頻等多種模態數據。模型在36項音頻及音視頻基準測試中22項...
閱讀原文

InternVL3.5

InternVL3.5(書生·萬象3.5)是上海人工智能實驗室開源的多模態大模型,模型在通用能力、推理能力和部署效率上全面升級,提供從10億到2410億參數的九種尺寸版...
閱讀原文

DeepSeek V3.1

DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具備混合推理架構,能自由切換思考模式與非思考模式,思考效率顯著提升。模型在V3的基礎上進行多項升級,上下...
閱讀原文

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5(簡稱SF-LLaVA-1.5)是專為長視頻理解設計的高效視頻大語言模型?;陔p流(SlowFast)機制,平衡處理更多輸入幀與減少每幀令牌數量之間...
閱讀原文

GLM-4.5V

GLM-4.5V是智譜開源的最新一代視覺推理模型。模型基于106B參數規模構建,擁有12B激活能力,是目前領先的視覺語言模型(VLM)。模型在GLM-4.1V-Thinking的基礎...
閱讀原文

Baichuan-M2

Baichuan-M2 是百川智能推出的開源醫療增強大模型。在醫療領域表現卓越,于HealthBench評測中以60.1分超越OpenAI的gpt-oss120b等眾多開源模型,登頂世界第一...
閱讀原文

Gemini 2.5 Deep Think

Gemini 2.5 Deep Think 是谷歌推出的 AI 模型,專為解決復雜任務設計。是獲得 2025 年國際數學奧林匹克競賽(IMO)金牌的模型的變體,通過并行思考技術(Para...
閱讀原文

GLM-4.5

GLM-4.5 是智譜推出的新一代旗艦模型,專為智能體應用打造,是首款原生融合推理、代碼和智能體能力的開源 SOTA 模型。采用混合專家(MoE)架構,有兩個版本:...
閱讀原文

OpenReasoning-Nemotron

OpenReasoning-Nemotron是英偉達開源的一系列推理能力強大的大型語言模型(LLM),基于DeepSeek R1 0528 模型蒸餾而成,參數規模涵蓋1.5B、7B、14B和32B。
閱讀原文

GLM-Experimental

GLM-Experimental 是智譜AI推出的實驗性大語言模型,已在旗下平臺 Z.ai 上線。模型支持自動生成PPT,用戶只需輸入主題或內容要點,可快速生成結構清晰、格式...
閱讀原文

DeepSeek R1T2

DeepSeek R1T2 (DeepSeek-TNG R1T2 Chimera)是TNG基于 DeepSeek 原始模型開發的改進型人工智能語言模型。采用 Tri-Mind 架構,融合了 DeepSeek R1-0528、R1...
閱讀原文

GLM-4.1V-Thinking

GLM-4.1V-Thinking是智譜AI推出的開源視覺語言模型,專為復雜認知任務設計,支持圖像、視頻、文檔等多模態輸入。模型在GLM-4V架構基礎上引入思維鏈推理機制,...
閱讀原文

RecGPT

RecGPT是淘天集團推出的百億參數推薦大模型?,F已全面接入手機淘寶首屏“猜你喜歡”信息流,基于融合多模態認知、用戶行為分析及實時熱點理解,精準捕捉用戶長...
閱讀原文

Qwen VLo

Qwen VLo 是通義千問團隊推出的多模態統一理解與生成模型。在多模態大模型的基礎上進行了全面升級,能“看懂”世界,能基于理解進行高質量的再創造,實現了從感...
閱讀原文

混元-A13B

混元-A13B是騰訊最新推出的開源大語言模型,基于專家混合(MoE)架構,總參數量達800億,激活參數為130億。具備輕量級設計和高效推理能力,僅需1張中低端GPU...
閱讀原文
123