AI項(xiàng)目和框架
presentation-ai
presentation-ai 是ALLWEONE團(tuán)隊(duì)推出的開源 AI 演示文稿生成工具,能根據(jù)用戶輸入的主題自動(dòng)生成完整的 PPT 大綱和精美的幻燈片,支持多種語言、主題風(fēng)格和自...
Doubao-Seed-Translation
Doubao-Seed-Translation 是字節(jié)跳動(dòng)團(tuán)隊(duì)推出的先進(jìn)多語言翻譯模型,支持 28 種語言互譯,涵蓋中英、日韓、德法等多種常用語言。
DeepSeek-V3.1-Terminus
DeepSeek-V3.1-Terminus 是 DeepSeek 團(tuán)隊(duì)推出的人工智能語言模型,是 DeepSeek-V3.1 的升級版本,主要優(yōu)化語言一致性和 Agent 能力,解決中英文混雜及異常字...
Qwen3-Omni
Qwen3-Omni是阿里通義團(tuán)隊(duì)推出的業(yè)界首個(gè)原生端到端全模態(tài)AI模型,能無縫處理文本、圖像、音頻和視頻等多種模態(tài)數(shù)據(jù)。模型在36項(xiàng)音頻及音視頻基準(zhǔn)測試中22項(xiàng)...
Qwen3-TTS-Flash
Qwen3-TTS-Flash 是阿里通義推出的支持多音色、多語言和多方言的旗艦語音合成模型。模型具備卓越的中英語音穩(wěn)定性,出色的多語言性能,及高表現(xiàn)力的擬人音色。
Qianfan-VL
Qianfan-VL是百度智能云千帆推出的面向企業(yè)級多模態(tài)應(yīng)用場景的視覺理解大模型。模型包含3B、8B和70B三種尺寸版本,具備出色的通用能力和針對OCR、教育等垂直...
LatticeWorld
LatticeWorld 是網(wǎng)易、香港城市大學(xué)、北京航空航天大學(xué)和清華大學(xué)等機(jī)構(gòu)推出的將大語言模型與工業(yè)級 3D 渲染引擎虛幻引擎 5 (Unreal Engine 5,UE5)結(jié)合的...
LongCat-Flash-Thinking
LongCat-Flash-Thinking 是美團(tuán)團(tuán)隊(duì)推出的擁有 5600 億參數(shù)的大型推理模型,基于專家混合(MoE)架構(gòu),支持根據(jù)需求動(dòng)態(tài)激活 186 億到 313 億參數(shù),兼顧計(jì)算...
Granite-Docling-258M – IBM推出的輕量級視覺語言模型
Granite-Docling-258M 是 IBM 推出的輕量級視覺語言模型,專為高效文檔轉(zhuǎn)換設(shè)計(jì)。模型能將文檔轉(zhuǎn)換為機(jī)器可讀格式,同時(shí)完整保留布局、表格、公式等元素。
LSP(Language Self-Play)
LSP(Language Self-Play)是Meta提出的一種強(qiáng)化學(xué)習(xí)方法,解決大型語言模型對大量高質(zhì)量訓(xùn)練數(shù)據(jù)的依賴問題。LSP的核心思想是利用自我博弈的方式,讓同一模...
TrafficVLM
TrafficVLM是高德導(dǎo)航推出的基于大模型技術(shù)的交通視覺語言模型,通過交通孿生還原能力,將海量實(shí)時(shí)交通數(shù)據(jù)轉(zhuǎn)化為動(dòng)態(tài)孿生視頻流,構(gòu)建出與現(xiàn)實(shí)世界同步的“數(shù)...
DeepSeek-R1-Safe
DeepSeek-R1-Safe 是浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院和華為合作推出的基于DeepSeek衍生的安全大模型。模型基于華為昇騰芯片和 MindSpeedLLM 框架,通過構(gòu)建安全語料...
粵公網(wǎng)安備 44011502001135號