標簽:知識圖譜構(gòu)建
Github 趨勢榜第一!開源 Agent 開發(fā)神器,任意文檔轉(zhuǎn) JSON、MD
原標題:Github 趨勢榜第一!開源 Agent 開發(fā)神器,任意文檔轉(zhuǎn) JSON、MD 文章來源:夕小瑤科技說 內(nèi)容字數(shù):5069字Docling:AGI時代文檔處理的利器 隨著人工...
Leya:多國法律支持的智能法律服務平臺助力律師高效審查、搜索與起草文件
Leya 是專為法律專業(yè)人士設計的AI法律服務平臺,基于集成AI工具優(yōu)化法律工作流程。Leya能自動化重復性任務,聚合信息,并提供對法律資源及用戶數(shù)據(jù)的一站式訪...
LeviTor:創(chuàng)新3D目標軌跡控制視頻合成技術提升視覺效果與交互體驗
LeviTor是南京大學、螞蟻集團、浙江大學等機構(gòu)推出的圖像到視頻合成技術,結(jié)合深度信息和K-means聚類點控制視頻中3D物體的軌跡,無需顯式的3D軌跡跟蹤。LeviT...
PaliGemma 2:DeepMind推出性視覺語言模型,實現(xiàn)跨媒體理解與生成
PaliGemma 2是Google DeepMind基于Gemma 2語言模型家族推出的新一代視覺語言模型(VLM),作為PaliGemma模型的升級版。結(jié)合SigLIP-So400m視覺編碼器和不同規(guī)...
Delta-CoMe:新型高效增量壓縮算法助力數(shù)據(jù)存儲優(yōu)化與傳輸提速
Delta-CoMe是清華大學NLP實驗室聯(lián)合OpenBMB開源社區(qū)、北京大學和上海財經(jīng)大學提出的新型增量壓縮算法,一個80G的A100 GPU能輕松加載多達50個7B模型,節(jié)省顯存...
LongRAG:雙視角魯棒檢索框架助力高效精準信息獲取
LongRAG是清華大學、中國科學院和智譜的研究團隊推出的,面向長文本問答(LCQA)的雙視角魯棒檢索增強生成(RAG)框架?;诨旌蠙z索器、LLM增強信息提取器、...
Frames:突破創(chuàng)意界限的AI圖像生成模型全面提升視覺藝術創(chuàng)作體驗
Frames是Runway推出的最新AI圖像生成模型,在風格控制和視覺保真度方面取得巨大進步。Frames能維持風格一致性,支持廣泛的創(chuàng)意探索,為項目建立特定外觀,并...
知周AI筆記:多功能本地AI筆記軟件助你高效組織與管理信息
知周AI筆記是多功能本地AI筆記,輕量級的本地Markdown筆記軟件,AI助理;AI續(xù)寫; AI一鍵生成小紅書/論文/大綱/競品分析等文案。支持Markdown語法,提供實時...
BALROG:評估大型語言模型與視覺語言模型在復雜動態(tài)環(huán)境中推理能力的基準測試工具
BALROG是評估大型語言模型(LLMs)和視覺語言模型(VLMs)在游戲上的推理能力,特別是模型在動態(tài)環(huán)境中的規(guī)劃、空間推理和探索能力。基于一系列挑戰(zhàn)性的游戲...
粵公網(wǎng)安備 44011502001135號