AI項目和框架

Memory Layers

Memory Layers是Meta推出的用可訓練的鍵值查找機制為模型增加額外參數的方法,它不會增加浮點運算次數(FLOPs)。基于稀疏激活補充計算密集型的前饋層,提供...
閱讀原文

Cognita

Cognita是開源的模塊化RAG(Retrieval Augmented Generation)框架,能幫助開發者構建模塊化、易于擴展和部署的生產級應用程序。Cognita用Langchain/LlamaInd...
閱讀原文

LAM

LAM是微軟推出的名為“Large Action Model”(簡稱 LAM)的新人工智能模型。與傳統語言模型不同,LAM能夠自主操作Windows程序,實現真實任務執行。 能理解文本...
閱讀原文

smolagents

smolagents 是 Hugging Face 推出的一個輕量級開源庫,旨在簡化智能代理的構建過程。極簡的代碼量(約千行)和直觀的API設計,使開發者能快速搭建和部署智能...
閱讀原文

REEF

REEF(Representation Encoding Fingerprints)是用于大型語言模型(LLM)的指紋識別技術。通過在模型訓練過程中嵌入特定的編碼信息,為每個模型生成一個唯一...
閱讀原文

Inf-DiT

Inf-DiT 是清華大學、智譜AI 推出基于擴散模型的圖像上采樣方法,能生成超高分辨率圖像。Inf-DiT引入單向塊注意力機制(UniBA),將生成過程中的空間復雜度從...
閱讀原文

SocraticLM

SocraticLM 是通過蘇格拉底式的教學法來教授數學的創新人工智能模型,模型由中科大和科大訊飛共同開發,采用了“Thought-Provoking”教學范式,通過提問引導學...
閱讀原文

VMix

VMix是創新的即插即用美學適配器,旨在提升文本到圖像擴散模型生成圖像的美學質量。通過解耦輸入文本提示中的內容描述和美學描述,將細粒度的美學標簽(如色...
閱讀原文

smoltalk-chinese

smoltalk-chinese 是OpenCSG開源的專為中文大型語言模型(LLM)設計的合成數據集,該數據集包含超過 70 萬條合成數據,涵蓋了信息查詢、推理、計劃、編輯、編...
閱讀原文

RLCM

RLCM(Reinforcement Learning for Consistency Model)是康奈爾大學推出用在優化文本到圖像生成模型的框架,基于強化學習方法微調一致性模型適應特定任務的...
閱讀原文

LLM2LLM

LLM2LLM是創新的迭代數據增強策略,旨在提升大型語言模型(LLM)在數據稀缺情況下的性能。方法通過基于一個強大的教師模型來生成合成數據,增強學生模型的訓...
閱讀原文

CodeElo

CodeElo 是用于評估大型語言模型(LLMs)在編程競賽級別代碼生成能力的基準測試工具。通過與人類程序員的 Elo 評級系統進行比較,來衡量 LLMs 的編程水平。工...
閱讀原文

FlexRAG

FlexRAG 是創新的檢索增強生成(RAG)框架,旨在解決傳統 RAG 系統在處理長上下文時面臨的計算成本高和生成質量不足的問題。通過將檢索到的上下文信息壓縮成...
閱讀原文

GeneralDyG

GeneralDyG 是南洋理工大學研究團隊提出的通用動態圖異常檢測方法,旨在解決動態圖數據在社交網絡、電商和網絡安全等領域的異常檢測問題。通過時間 ego-graph...
閱讀原文

LangGraph

LangGraph是為構建狀態化、多智能體(Multi-Agent) 系統而設計的,特別是與大型語言模型(LLMs)一起使用時,用在創建代理和多代理工作流。作為 LangChain ...
閱讀原文
18586878889155