標簽:自然語言理解
Mind GPT-3o
Mind GPT-3o是理想汽車推出的多模態端到端大模型,融合語音、視覺和語言理解技術,實現高效實時交互。Mind GPT-3o具備記憶、規劃、工具使用和表達能力,能提...
Bamba-9B:Mamba2架構驅動的高效解碼語言模型展現卓越性能與靈活應用
Bamba-9B是IBM、普林斯頓大學、卡內基梅隆大學和伊利諾伊大學香檳分校聯合推出的,基于Mamba2架構的僅解碼語言模型模型。模型在完全開放的數據集上訓練,能提...
Lyra:提升多模態交互體驗的SmartMore創新解決方案
Lyra是香港中文大學、SmartMore和香港科技大學推出的高效多模態大型語言模型(MLLM),專注于提升語音、視覺和語言模態的交互能力。Lyra基于開源大型模型、多...
Large Action Models:微軟行動大模型開發框架助力高效智能應用構建與部署
Large Action Models(LAMs)是微軟推出大型行動模型的開發框架,能執行真實世界行動的智能系統,LAMs超越傳統LLMs(Large Language Models,大型語言模型)...
EMOVA:華為諾亞方舟多模態處理模型全面提升智能交互與應用效率
EMOVA(EMotionally Omni-present Voice Assistant)是多模態全能模型,是香港科技大學、香港大學和華為諾亞方舟實驗室等機構共同推出的。EMOVA能處理圖像、...
Devika AI:智能AI助手助力高效執行復雜任務
Devika AI是印度Stition AI團隊推出的開源AI軟件開發工具,能理解并執行復雜的人類指令,將其分解為步驟,進行研究和信息搜集,最終編寫代碼以實現目標。Devi...
NVLM:英偉達推出的多模態大型語言模型賦能跨領域智能交互與應用
NVLM是NVIDIA推出的前沿多模態大型語言模型(LLMs),在視覺-語言任務上達到與頂尖專有模型(如GPT-4o)和開放訪問模型(如Llama 3-V 405B和InternVL 2)相匹...
QwQ-32B-Preview:超越O1模型的阿里開源AI推理產品實現高效精準的智能決策
QwQ-32B-Preview(QwQ-32B)是阿里巴巴開源的實驗性研究AI模型,以強大的推理能力著稱,尤其在數學和編程領域表現卓越。QwQ-32B-Preview包含325億參數,能處...
ACE:全能圖像生成與編輯模型賦能創意無限可能
ACE(All-round Creator and Editor)是阿里巴巴集團Tongyi Lab推出的基于擴散變換器的全能圖像生成和編輯模型。ACE引入長上下文條件單元(LCU)和統一條件格...