AI工具

OneSearch

OneSearch 是快手推出的電商搜索端到端生成式框架,優(yōu)化傳統(tǒng)電商搜索的級聯(lián)式架構,提升搜索精準度和用戶體驗。三大創(chuàng)新點包括:關鍵詞增強層次量化編碼(KHQ...
閱讀原文

Codexia

Codexia是強大的跨平臺AI編碼桌面應用程序,支持為OpenAI Codex CLI提供圖形界面和工具集,增強開發(fā)體驗。
閱讀原文

Lego-Edit

Lego-Edit 是小米開源的基于指令的圖像編輯框架,通過多模態(tài)大語言模型(MLLM)的泛化能力,實現(xiàn)對圖像的靈活編輯。采用模型級工具包,包含多種高效訓練的模...
閱讀原文

混元3D Studio

混元3D Studio(Hunyuan3D Studio)是騰訊推出的一站式3D創(chuàng)作平臺,基于AI技術加速3D內容創(chuàng)作全流程。平臺支持從概念設計到動畫制作的各個環(huán)節(jié),包括高效的概...
閱讀原文

CapCut AI Suite

CapCut AI Suite 是字節(jié)推出的 AI 驅動的創(chuàng)意編輯工具,能將任何主題快速轉化為完整視頻,提供 AI 圖像、視頻、音樂生成等功能,支持自動剪輯、轉錄、翻譯等...
閱讀原文

FastMTP

FastMTP 是騰訊自研的大語言模型(LLM)推理加速技術,通過優(yōu)化多標記預測(MTP)技術,用共享權重的單 MTP 頭替代傳統(tǒng)多獨立模塊,結合語言感知詞匯壓縮和自...
閱讀原文

Xiaomi-MiMo-Audio

Xiaomi-MiMo-Audio是小米開源的首個原生端到端語音大模型。模型基于創(chuàng)新預訓練架構和上億小時訓練數(shù)據(jù),首次在語音領域實現(xiàn)了基于 In-Context Learning(ICL...
閱讀原文

Lucy Edit Dev

Lucy Edit Dev 是 Decart AI 團隊開源的基于文本指令的視頻編輯模型。能根據(jù)簡單的文本提示對視頻進行多種編輯操作,如更改服裝、替換角色、插入對象和轉換場...
閱讀原文

Wan2.2-Animate

Wan2.2-Animate是阿里通義團隊推出的動作生成模型,模型同時支持動作模仿和角色扮演兩種模式,能基于表演者的視頻,精確復制面部表情和動作,生成高度逼真的...
閱讀原文

Ling-V2

Ling-V2 是螞蟻百靈團隊推出的基于 MoE 架構的大型語言模型家族,首個版本 Ling-mini-2.0 擁有 160 億總參數(shù),每個輸入標記僅激活 14 億參數(shù)。
閱讀原文

Viking 長期記憶

Viking長期記憶是火山引擎推出的端到端長期記憶標準產品,基于自研VikingDB向量數(shù)據(jù)庫,具備百億級數(shù)據(jù)毫秒級檢索能力,能精準抽取事件與用戶畫像,支持語義...
閱讀原文

VoxCPM

VoxCPM 是面壁智能與清華大學深圳國際研究生院聯(lián)合開發(fā)的 0.5B 參數(shù)語音生成模型。在語音合成的自然度、音色相似度及韻律表現(xiàn)力方面達到了業(yè)界頂尖水平。VoxC...
閱讀原文

InternVLA-A1

InternVLA-A1 是上海人工智能實驗室和國家地方共建人形機器人創(chuàng)新中心聯(lián)合發(fā)布的具身操作大模型。具備理解、想象、執(zhí)行一體化的能力,能精準地完成任務。模型...
閱讀原文

ReSum

ReSum 是阿里通義推出的新型WebAgent 推理范式,隸屬通義DeepResearch家族,能解決 WebAgent 在長視界任務中面臨的上下文長度限制問題,通過周期性地對交互歷...
閱讀原文

Octofriend

Octofriend 是智能編程助手,能像貼心伙伴一樣在 GPT-5、Claude 等大型語言模型(LLM)間自由切換,根據(jù)任務需求挑選最優(yōu)模型。
閱讀原文
11314151617282