標簽:多模態理解
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...
Qwen3-Omni
Qwen3-Omni是阿里通義團隊推出的業界首個原生端到端全模態AI模型,能無縫處理文本、圖像、音頻和視頻等多種模態數據。模型在36項音頻及音視頻基準測試中22項...
InternVL3.5
InternVL3.5(書生·萬象3.5)是上海人工智能實驗室開源的多模態大模型,模型在通用能力、推理能力和部署效率上全面升級,提供從10億到2410億參數的九種尺寸版...
DeepSeek V3.1
DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具備混合推理架構,能自由切換思考模式與非思考模式,思考效率顯著提升。模型在V3的基礎上進行多項升級,上下...
SlowFast-LLaVA-1.5
SlowFast-LLaVA-1.5(簡稱SF-LLaVA-1.5)是專為長視頻理解設計的高效視頻大語言模型?;陔p流(SlowFast)機制,平衡處理更多輸入幀與減少每幀令牌數量之間...
Baichuan-M2
Baichuan-M2 是百川智能推出的開源醫療增強大模型。在醫療領域表現卓越,于HealthBench評測中以60.1分超越OpenAI的gpt-oss120b等眾多開源模型,登頂世界第一...
Gemini 2.5 Deep Think
Gemini 2.5 Deep Think 是谷歌推出的 AI 模型,專為解決復雜任務設計。是獲得 2025 年國際數學奧林匹克競賽(IMO)金牌的模型的變體,通過并行思考技術(Para...
OpenReasoning-Nemotron
OpenReasoning-Nemotron是英偉達開源的一系列推理能力強大的大型語言模型(LLM),基于DeepSeek R1 0528 模型蒸餾而成,參數規模涵蓋1.5B、7B、14B和32B。
GLM-Experimental
GLM-Experimental 是智譜AI推出的實驗性大語言模型,已在旗下平臺 Z.ai 上線。模型支持自動生成PPT,用戶只需輸入主題或內容要點,可快速生成結構清晰、格式...
DeepSeek R1T2
DeepSeek R1T2 (DeepSeek-TNG R1T2 Chimera)是TNG基于 DeepSeek 原始模型開發的改進型人工智能語言模型。采用 Tri-Mind 架構,融合了 DeepSeek R1-0528、R1...
GLM-4.1V-Thinking
GLM-4.1V-Thinking是智譜AI推出的開源視覺語言模型,專為復雜認知任務設計,支持圖像、視頻、文檔等多模態輸入。模型在GLM-4V架構基礎上引入思維鏈推理機制,...