AI項(xiàng)目和框架

presentation-ai

presentation-ai 是ALLWEONE團(tuán)隊(duì)推出的開源 AI 演示文稿生成工具,能根據(jù)用戶輸入的主題自動(dòng)生成完整的 PPT 大綱和精美的幻燈片,支持多種語言、主題風(fēng)格和自...
閱讀原文

Doubao-Seed-Translation

Doubao-Seed-Translation 是字節(jié)跳動(dòng)團(tuán)隊(duì)推出的先進(jìn)多語言翻譯模型,支持 28 種語言互譯,涵蓋中英、日韓、德法等多種常用語言。
閱讀原文

DeepSeek-V3.1-Terminus

DeepSeek-V3.1-Terminus 是 DeepSeek 團(tuán)隊(duì)推出的人工智能語言模型,是 DeepSeek-V3.1 的升級版本,主要優(yōu)化語言一致性和 Agent 能力,解決中英文混雜及異常字...
閱讀原文

Qwen3-Omni

Qwen3-Omni是阿里通義團(tuán)隊(duì)推出的業(yè)界首個(gè)原生端到端全模態(tài)AI模型,能無縫處理文本、圖像、音頻和視頻等多種模態(tài)數(shù)據(jù)。模型在36項(xiàng)音頻及音視頻基準(zhǔn)測試中22項(xiàng)...
閱讀原文

Qwen3-TTS-Flash

Qwen3-TTS-Flash 是阿里通義推出的支持多音色、多語言和多方言的旗艦語音合成模型。模型具備卓越的中英語音穩(wěn)定性,出色的多語言性能,及高表現(xiàn)力的擬人音色。
閱讀原文

Qianfan-VL

Qianfan-VL是百度智能云千帆推出的面向企業(yè)級多模態(tài)應(yīng)用場景的視覺理解大模型。模型包含3B、8B和70B三種尺寸版本,具備出色的通用能力和針對OCR、教育等垂直...
閱讀原文

LatticeWorld

LatticeWorld 是網(wǎng)易、香港城市大學(xué)、北京航空航天大學(xué)和清華大學(xué)等機(jī)構(gòu)推出的將大語言模型與工業(yè)級 3D 渲染引擎虛幻引擎 5 (Unreal Engine 5,UE5)結(jié)合的...
閱讀原文

LongCat-Flash-Thinking

LongCat-Flash-Thinking 是美團(tuán)團(tuán)隊(duì)推出的擁有 5600 億參數(shù)的大型推理模型,基于專家混合(MoE)架構(gòu),支持根據(jù)需求動(dòng)態(tài)激活 186 億到 313 億參數(shù),兼顧計(jì)算...
閱讀原文

Granite-Docling-258M – IBM推出的輕量級視覺語言模型

Granite-Docling-258M 是 IBM 推出的輕量級視覺語言模型,專為高效文檔轉(zhuǎn)換設(shè)計(jì)。模型能將文檔轉(zhuǎn)換為機(jī)器可讀格式,同時(shí)完整保留布局、表格、公式等元素。
閱讀原文

LSP(Language Self-Play)

LSP(Language Self-Play)是Meta提出的一種強(qiáng)化學(xué)習(xí)方法,解決大型語言模型對大量高質(zhì)量訓(xùn)練數(shù)據(jù)的依賴問題。LSP的核心思想是利用自我博弈的方式,讓同一模...
閱讀原文

TrafficVLM

TrafficVLM是高德導(dǎo)航推出的基于大模型技術(shù)的交通視覺語言模型,通過交通孿生還原能力,將海量實(shí)時(shí)交通數(shù)據(jù)轉(zhuǎn)化為動(dòng)態(tài)孿生視頻流,構(gòu)建出與現(xiàn)實(shí)世界同步的“數(shù)...
閱讀原文

DeepSeek-R1-Safe

DeepSeek-R1-Safe 是浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院和華為合作推出的基于DeepSeek衍生的安全大模型。模型基于華為昇騰芯片和 MindSpeedLLM 框架,通過構(gòu)建安全語料...
閱讀原文

Kronos

Kronos 是首個(gè)面向金融市場的 K 線圖基礎(chǔ)模型,由清華大學(xué)與微軟亞洲研究院聯(lián)合開源。通過分析股票、加密貨幣等資產(chǎn)的 K 線數(shù)據(jù),包括開盤價(jià)、最高價(jià)、最低價(jià)...
閱讀原文

OneSearch

OneSearch 是快手推出的電商搜索端到端生成式框架,優(yōu)化傳統(tǒng)電商搜索的級聯(lián)式架構(gòu),提升搜索精準(zhǔn)度和用戶體驗(yàn)。三大創(chuàng)新點(diǎn)包括:關(guān)鍵詞增強(qiáng)層次量化編碼(KHQ...
閱讀原文

Codexia

Codexia是強(qiáng)大的跨平臺AI編碼桌面應(yīng)用程序,支持為OpenAI Codex CLI提供圖形界面和工具集,增強(qiáng)開發(fā)體驗(yàn)。
閱讀原文
1910111213155