標簽:自然語言處理

Zyler AI

Zyler AI 是專注于營銷分析的人工智能平臺,幫助企業(yè)和專業(yè)人士快速生成高質量的分析報告。通過一鍵集成 Google Analytics、Meta Ads 等主流數(shù)據(jù)源,基于強大...
閱讀原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI優(yōu)化框架,在推理階段對語言模型輸出進行動態(tài)優(yōu)化,更符合人類偏好。TPO通過將獎勵信號轉化為文本反饋,...
閱讀原文

TurboTTS

TurboTTS 是免費的在線文本轉語音工具,支持70多種語言和300多種真實語音選擇,能生成自然、逼真的語音效果,適用于短視頻創(chuàng)作、在線教育、廣告制作、播客等...
閱讀原文

ACE++

ACE++是阿里巴巴通義實驗室推出的先進的圖像生成與編輯工具,通過指令化和上下文感知的內容填充技術,實現(xiàn)了高質量的圖像創(chuàng)作和編輯功能。
閱讀原文

LLaVA-Rad

LLaVA-Rad是微軟研究院推出的小型多模態(tài)模型,專注于臨床放射學報告生成。是LLaVA-Med項目的分支,特別是胸部X光(CXR)成像。基于LLaVA-Med的基礎架構和訓練...
閱讀原文

FireRedASR

FireRedASR 是小紅書開源的工業(yè)級自動語音識別(ASR)模型家族,支持普通話、中文方言和英語,在普通話 ASR 基準測試中達到了新的最佳水平(SOTA),在歌詞識...
閱讀原文

MVoT

MVoT(Multimodal Visualization-of-Thought)是微軟研究院、劍橋大學語言技術實驗室、中國科學院自動化研究所推出的新型多模態(tài)推理范式,基于生成圖像可視化...
閱讀原文

HMA

HMA(Heterogeneous Masked Autoregression)是麻省理工學院、Meta和伊利諾伊大學香檳分校開源的,用在建模機器人動作視頻動態(tài)的方法。HMA基于異構預訓練,用...
閱讀原文

鯨噴 DeepRant

DeepRant(中文名:鯨噴)是專為游戲玩家設計的多語言快捷翻譯工具。DeepRant能夠幫助玩家在國際服務器中快速進行文字交流,消除語言障礙。玩家在游戲中選中...
閱讀原文

Agno

Agno 是構建智能代理(Agents)的輕量級框架。Agno 支持多模態(tài)(文本、圖像、音頻、視頻)和多代理協(xié)作,能快速創(chuàng)建代理,速度比 LangGraph 快 5000 倍,支持...
閱讀原文

Ola

Ola是清華大學、騰訊 Hunyuan 研究團隊和新加坡國立大學 S-Lab 合作開發(fā)的全模態(tài)語言模型。通過漸進式模態(tài)對齊策略,逐步擴展語言模型支持的模態(tài),從圖像和文...
閱讀原文

BEN2

BEN2(Background Erase Network 2)是Prama LLC開發(fā)的深度學習模型,專門用于從圖像和視頻中快速移除背景并提取前景。基于創(chuàng)新的置信度引導摳圖(CGM)管道...
閱讀原文

AstrBot

AstrBot 是多平臺聊天機器人及開發(fā)框架,支持多種大語言模型(如 OpenAI GPT、Google Gemini、Llama 等)和多種消息平臺(如 QQ、Telegram、微信等)。AstrBo...
閱讀原文

Eino

Eino 是字節(jié)跳動開源的大模型應用開發(fā)框架,能幫助開發(fā)者高效構建基于大模型的 AI 應用。Eino以 Go 語言為基礎,具備穩(wěn)定的內核、靈活的擴展性和完善的工具生...
閱讀原文

倍客AI

倍客AI是專注于 AI 內容創(chuàng)作的平臺,通過人工智能技術為商業(yè)攝影、廣告設計、電商展示等領域提供高效、高質量的創(chuàng)意解決方案。平臺的核心功能包括 AI 商圖、A...
閱讀原文
1202122232468