標簽：信息檢索

RWKV-7

RWKV-7是RWKV系列的最新大模型架構版本，超越了傳統的attention和linear attention范式，具有更靈活的狀態演化能力，能在相同算力消耗下解決attention無法解...

閱讀原文

AI工具

11個月前

AniDoc：自動化草圖到彩色動畫轉化的創新視頻擴散模型

AniDoc是香港科技大學、螞蟻集團、南京大學、浙江大學和香港大學共同推出的簡化2D動畫上色AI模型，基于視頻擴散模型自動將草圖序列轉換成彩色動畫，遵循參考...

閱讀原文

AI工具

11個月前

Pi：多種生成方式的智能創作平臺助力高效內容創作

Pi（Presentation Intelligence）是AI-Native的互動內容創作和共享平臺，基于AI簡化演示文檔的創作過程。Pi支持多種內容生成方式，包括一句話生成、文件導入...

閱讀原文

AI工具

11個月前

突破RAG的局限：探尋向量數據庫的真實價值與應用潛力

2024中國生成式AI大會（上海站）12月5-6日舉辦～

閱讀原文

AIGC動態

12個月前

Lamucal：智能音樂創作助手實時生成和弦、吉他譜、歌詞與旋律

Lamucal是AI驅動的音樂創作工具，能實時生成任何歌曲的和弦、吉他譜、歌詞和旋律。Lamucal支持互動學習，用戶能將音樂轉換成可演奏的和弦，并基于AI翻唱功能...

閱讀原文

AI工具

12個月前

Promptriever：智能家居助手提升生活質量的五大關鍵特點

Promptriever 是約翰斯·霍普金斯大學和Samaya AI聯合推出的新型檢索模型，能像語言模型一樣接受自然語言提示，用直觀的方式響應用戶的搜索需求。Promptriever...

閱讀原文

AI工具

12個月前

SmolVLM：輕量級視覺語言模型助力多模態任務的高效解決方案

SmolVLM是Hugging Face推出的輕量級視覺語言模型，專為設備端推理設計。以20億參數量，實現了高效內存占用和快速處理速度。SmolVLM提供了三個版本以滿足不同...

閱讀原文

AI工具

12個月前

解鎖多模態檢索的未來：Jina CLIP v2向量模型的之旅

多語言多模態的文本圖像Embedding模型

閱讀原文

AIGC動態

12個月前

DeepSeek-R1-Lite：DeepSeek推理模型預覽版全面提升智能分析與預測能力

DeepSeek-R1-Lite是DeepSeek推出的推理模型預覽版，DeepSeek-R1-Lite用強化學習訓練，具備長思維鏈推理能力，能實時展示推理思考過程，性能在多個基準測試中...

閱讀原文

AI工具

12個月前

RAG-Diffusion：區域感知文本到圖像生成技術的創新應用與優勢分析

RAG-Diffusion是南京大學團隊推出的區域感知文本到圖像生成方法。基于區域硬綁定和區域軟細化兩個階段，實現對圖像中各個區域的精確控制和細節優化。RAG-Diff...

閱讀原文

AI工具

12個月前

MSQA：大規模多模態3D場景推理數據集

MSQA（Multi-modal Situated Question Answering）是大規模多模態情境推理數據集，提升具身AI代理在3D場景中的理解與推理能力。數據集包含251K個問答對，覆蓋...

閱讀原文

AI工具

1年前 (2024)

什么是嵌入向量（Embedding Vectors）：人工智能的基本概念與應用領域

嵌入向量（Embedding Vectors）是一種將數據（如文本、圖像、用戶信息）映射到高維空間中的數字向量的技術。能夠捕捉數據間的相似性和關系，使得相似的數據點...

閱讀原文

AI百科

1年前 (2024)

Llama3.1

Llama 3.1是Meta最新發布的開源AI模型，包括8B、70B和405B三個版本，其中405B版本以其4050億參數量成為目前最大的開源模型之一。Llama 3.1支持128K的上下文長...

閱讀原文

AI項目和框架

1年前 (2024)

HybridRAG

HybridRAG 是黑石聯合英偉達推出的混合檢索增強生成架構，結合了檢索增強生成（Retrieval-Augmented Generation）模型的機器學習架構。模型通過檢索系統尋找...

閱讀原文

AI工具

1年前 (2024)

RAGFlow

RAGFlow 是開源的 RAG（Retrieval-Augmented Generation）引擎，擁有深入理解文檔并增強生成能力，是基于OCR和文檔解析的下一代 RAG 引擎。RAGFlow通過集成自...

閱讀原文

AI工具

1年前 (2024)

123