AI項目和框架

Qwen2.5-Turbo:超高上下文理解能力的長文本模型實現(xiàn)1M tokens支持,助力智能文本生成與分析

Qwen2.5-Turbo是阿里推出的先進語言模型,將上下文長度從 128k 擴展到了 1M ,相當于100萬個英文單詞或150萬個漢字。擴展讓模型能處理更長的文本,如長篇小說...
閱讀原文

LLaVA-o1:開源視覺語言模型助力智能理解與生成內(nèi)容

LLaVA-o1是北京大學、清華大學、鵬城實驗室、阿里巴巴達摩院以及理海大學(Lehigh University)組成的研究團隊推出的開源視覺語言模型,基于Llama-3.2-Vision...
閱讀原文

PixelWave Flux:FLUX.1-dev模型微調版賦能創(chuàng)意圖像生成的全新可能

PixelWave Flux.1-dev 03是基于FLUX.1-dev模型在NVIDIA 4090上微調的AI圖像生成模型,有卓越的模型泛化能力,模型在處理多種藝術風格、攝影和動漫圖像方面表...
閱讀原文

Computer Use OOTB:基于Claude 3.5 API的開源GUI框架實現(xiàn)高效遠程控制解決方案

Computer Use OOTB是開源的GUI 框架,基于Claude 3.5 Computer Use API實現(xiàn)對計算機的自動化控制??蚣苤С挚缙脚_操作,用戶在Windows和macOS系統(tǒng)上能輕松部...
閱讀原文

Fireworks f1:復合AI模型融合多元開源技術以應對復雜推理挑戰(zhàn)

Fireworks f1是Fireworks公司推出的復合AI模型,針對復雜推理任務設計。基于在推理層融合多個開放模型,實現(xiàn)超越單一模型的性能和可靠性。f1模型支持開發(fā)者用...
閱讀原文

AgileGen:智能代碼自動生成與原型設計的創(chuàng)新解決方案

AgileGen是生成式軟件開發(fā)框架,通過人與AI協(xié)作增強軟件的創(chuàng)建過程。AgileGen包含兩個核心部分:終端用戶決策制定和AgileGen智能體。框架用Gherkin語言設計和...
閱讀原文

OmniSearch:多模態(tài)智能檢索與生成技術的全面升級

OmniSearch是阿里巴巴通義實驗室推出的多模態(tài)檢索增強生成框架,具備自適應規(guī)劃能力。OmniSearch能動態(tài)拆解復雜問題,根據(jù)檢索結果和問題情境調整檢索策略,...
閱讀原文

Perplexica:智能開源AI搜索引擎實現(xiàn)多模式搜索與實時信息更新

Perplexica是開源的AI驅動搜索引擎,是Perplexity AI的開源替代品?;跈C器學習算法和自然語言處理技術理解用戶查詢,提供精確答案。Perplexica支持多種搜索...
閱讀原文

Memoripy:智能記憶管理庫助力上下文感知的AI應用開發(fā)

Memoripy是一個Python庫,為AI應用提供上下文感知的記憶管理。Memoripy支持短期和長期記憶存儲,兼容OpenAI和Ollama API。核心功能包括記憶檢索、概念提取、...
閱讀原文

AnimateAnything:創(chuàng)新統(tǒng)一可控視頻生成技術提升內(nèi)容創(chuàng)作效率

AnimateAnything是浙江大學和北京航空航天大學研究者推出的統(tǒng)一可控視頻生成技術。AnimateAnything能精確操作視頻,包括控制相機軌跡、文本提示和用戶動作注...
閱讀原文

RAG-Diffusion:區(qū)域感知文本到圖像生成技術的創(chuàng)新應用與優(yōu)勢分析

RAG-Diffusion是南京大學團隊推出的區(qū)域感知文本到圖像生成方法。基于區(qū)域硬綁定和區(qū)域軟細化兩個階段,實現(xiàn)對圖像中各個區(qū)域的精確控制和細節(jié)優(yōu)化。RAG-Diff...
閱讀原文

FitDiT:騰訊與復旦攜手打造的高保真虛擬試穿技術實現(xiàn)無縫體驗與精準匹配

FitDiT是高保真虛擬試穿技術,是騰訊和復旦大學聯(lián)合推出的?;贒iffusion Transformers(DiT)關注高分辨率特征,提升服裝細節(jié)的呈現(xiàn)。FitDiT用服裝紋理提取...
閱讀原文

Documind:高效PDF轉圖像工具助力結構化數(shù)據(jù)提取

Documind是開源的AI文檔處理工具,能從PDF文檔中提取結構化數(shù)據(jù)。Documind具備將PDF轉換為圖像、用OpenAI API進行信息提取,根據(jù)用戶定義的模式格式化輸出結...
閱讀原文

MARS:提升大模型訓練效率的字節(jié)優(yōu)化框架解析

MARS(Make vAriance Reduction Shine)是字節(jié)跳動推出的創(chuàng)新的優(yōu)化框架,提升大型模型訓練的效率。MARS融合預條件梯度方法與方差減少技術,基于縮放隨機遞歸...
閱讀原文

Verifier Engineering:創(chuàng)新后訓練范式推動產(chǎn)品智能化與個性化升級

Verifier Engineering(驗證器工程)是中國科學院、阿里巴巴和小紅書聯(lián)合推出的新型后訓練范式,為基礎模型設計,解決提供有效監(jiān)督信號的挑戰(zhàn)。Verifier Engi...
閱讀原文