標簽:多語言支持

VACE

VACE(Video Creation and Editing)是阿里巴巴通義實驗室推出的一站式視頻生成與編輯框架。基于整合多種視頻任務(如參考視頻生成、視頻到視頻編輯、遮罩編...
閱讀原文

MHA2MLA

MHA2MLA是復旦大學、華東師范大學、上海AI Lab等機構聯合推出的數據高效的微調方法,基于引入DeepSeek的多頭潛在注意力機制(MLA),優化任何基于Transformer...
閱讀原文

Macro PDF

Macro PDF 是 AI PDF 編輯器,專為學術、法律和金融領域的專業人士設計。通過強大的 AI 技術,將復雜的 PDF 文檔轉化為智能文檔,幫助用戶快速提取關鍵信息、...
閱讀原文

START

START(Self-Taught Reasoner with Tools)是阿里巴巴集團和中國科學技術大學推出的新型工具增強型推理模型,結合外部工具(如Python代碼執行器)提升大型語...
閱讀原文

R1-Omni

R1-Omni 是阿里通義推出的基于強化學習(RLVR)的全模態大語言模型,專注于情感識別任務。通過結合視覺和音頻信息,能清晰地解釋情感識別的推理過程,展現出...
閱讀原文

Zulu

Zulu 是百度文心快碼推出的AI自動編程智能體,為開發者提供從需求到代碼的端到端生成服務。能自主理解編碼需求,精準拆解任務,突破單文件限制,實現跨模塊、...
閱讀原文

COMET

COMET是字節跳動推出的針對Mixture-of-Experts(MoE)模型的優化系統,能解決分布式訓練中通信開銷過大的問題?;诩毩6鹊挠嬎?通信重疊技術,COMET將通信...
閱讀原文

Gemini Embedding

Gemini Embedding 是 Google 推出的先進的文本嵌入模型,基于將文本轉化為高維數值向量,捕捉其語義和上下文信息。Gemini Embedding基于 Gemini 模型訓練,具...
閱讀原文

Cardamon

Cardamon 是 Y Combinator 推出 AI 驅動的合規平臺,專為受監管的金融機構設計,通過自動化法規映射幫助企業快速實現合規。基于人工智能技術,將復雜的法規文...
閱讀原文

Chikka.ai

Chikka.ai 是專注于客戶訪談的AI平臺,基于AI語音代理Ava,與受訪者進行自然對話,快速收集分析語音反饋。Chikka.ai支持多語言訪談,能同時進行數百次對話,...
閱讀原文

Duck.ai

Duck.ai 是 DuckDuckGo 搜索引擎推出的免費私密的 AI 聊天服務,用戶無需注冊即可使用。通過代理技術隱藏用戶 IP 地址,確保聊天內容不會被用于 AI 模型訓練...
閱讀原文

OpenManus

OpenManus 是MetaGPT 團隊推出的開源復刻版?Manus,提供無需邀請碼的 AI Agent 。OpenManus基于模塊化設計,支持多種語言模型和工具鏈,能執行代碼、處理文件...
閱讀原文

NEXUS-O

NEXUS-O 是HiThink 研究院、英國帝國理工學院、浙江大學、復旦大學、微軟、Meta AI等機構推出的多模態AI模型,能實現對語言、音頻和視覺信息的全方位感知與交...
閱讀原文

tellers.ai

tellers.ai 是AI視頻生成工具,專注于將文本內容快速轉化為高質量視頻。用戶只需輸入文本,平臺會自動分析內容從真實視頻庫中選取相關素材,生成具有吸引力的...
閱讀原文

Mercury Coder

Mercury Coder 是 Inception Labs 推出的首個擴散型大語言模型(dLLM),是 Mercury 系列中專門用在代碼生成的模型。Mercury Coder基于“從粗到細”的生成方式...
閱讀原文
1121314151661