標簽:對話系統

OpenAI o3

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

RWKV-7

RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
閱讀原文

RWKV-7:RWKV系列大模型架構提升上下文學習能力的創新產品特性解析

RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
閱讀原文

OpenAI o3:OpenAI推出超強推理模型,智能提升與創新思維的完美結合

OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
閱讀原文

貍譜:靈魂提取與創意壁紙的完美融合

貍譜(離譜小程序)是貍譜團隊與國內頂尖AI公司階躍星辰合作推出的AI小程序,命名為“靈魂提取器”。貍譜小程序能用拍照或上傳圖片,一鍵提取物體的靈魂,即生...
閱讀原文

Takin AudioLLM:創新零樣本語音生成模型助力個性化語音合成體驗

Takin AudioLLM是喜馬拉雅Everest團隊推出的一系列高質量零樣本語音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型語言模型技術,專...
閱讀原文

揭開ChatGPT的神秘面紗:智能對話背后的秘密與未來趨勢

本文從基本概念出發,介紹和解釋ChatGPT用到的一系列關鍵技術,如機器學習、神經網絡、大模型、預訓練+微調范式、Scaling Law……并對ChatGPT未來可能應用領域...
閱讀原文

BlueLM-V-3B:ViVo與香港中文大學攜手創新算法與系統協同設計方法提升產品智能化水平

BlueLM-V-3B是vivo AI Lab和香港中文大學MMLab聯合推出的算法和系統協同設計方法,支持高效部署多模態大型語言模型(MLLM)至移動設備。模型以小尺寸(2.7B語...
閱讀原文

Florence-2:多功能視覺語言模型提升跨模態理解與應用能力

Florence-2 是微軟 Azure AI 團隊推出的多功能視覺模型,能執行圖像描述、目標檢測、視覺定位和圖像分割等多種計算機視覺任務。Florence-2 基于 Transformer ...
閱讀原文

EMO

EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院的研究人員開發的框架,一個音頻驅動的AI肖像視頻生成系統,能夠通過輸入單一的參考圖像和語...
閱讀原文

Llama 3

Llama 3是Meta公司最新開源推出的新一代大型語言模型(LLM),包含8B和70B兩種參數規模的模型,標志著開源人工智能領域的又一重大進步。作為Llama系列的第三...
閱讀原文

DCLM-7B

DCLM-7B是由蘋果公司聯合研究團隊推出的70億參數開源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,蘋果公司作為 DataComp-LM(DCLM)項目的研究機...
閱讀原文

Llama3.1

Llama 3.1是Meta最新發布的開源AI模型,包括8B、70B和405B三個版本,其中405B版本以其4050億參數量成為目前最大的開源模型之一。Llama 3.1支持128K的上下文長...
閱讀原文

Falcon Mamba 7B

Falcon Mamba 7B是阿聯酋技術創新研究所(TII)推出的開源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用編碼器-解碼器結構和多頭注意...
閱讀原文