標(biāo)簽:語(yǔ)音識(shí)別

Audio-SDS

Audio-SDS是NVIDIA AI研究團(tuán)隊(duì)推出的創(chuàng)新技術(shù),將Score Distillation Sampling(SDS)技術(shù)擴(kuò)展至文本條件音頻擴(kuò)散模型,為音頻處理領(lǐng)域帶來(lái)了重大突破。無(wú)需...
閱讀原文

Day.ai

Day.ai 是 HubSpot 前高管創(chuàng)立的 AI 原生 CRM 工具,通過 AI 技術(shù)自動(dòng)從電子郵件和視頻會(huì)議中提取信息,為客戶創(chuàng)建完善的 CRM 系統(tǒng)。核心功能包括AI 驅(qū)動(dòng)的會(huì)...
閱讀原文

BILIVE

BILIVE 是一款基于 AI 技術(shù)的開源工具,專為 B 站直播錄制與處理設(shè)計(jì)。工具支持自動(dòng)錄制直播、渲染彈幕和字幕,支持語(yǔ)音識(shí)別、自動(dòng)切片精彩片段,生成有趣的...
閱讀原文

Mogao

Mogao是字節(jié)跳動(dòng)Seed團(tuán)隊(duì)推出的交錯(cuò)多模態(tài)生成全基礎(chǔ)模型。在架構(gòu)上采用了雙視覺編碼器,結(jié)合變分自編碼器(VAE)和視覺變換器(ViT),能更好地進(jìn)行視覺理解...
閱讀原文

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是英偉達(dá)推出的開源自動(dòng)語(yǔ)音識(shí)別(ASR)模型。采用FastConformer編碼器和TDT解碼器架構(gòu),通過預(yù)測(cè)文本標(biāo)記及其持續(xù)時(shí)間加速推理,減少計(jì)算...
閱讀原文

oli

oli 是開源的智能代碼助手,支持為開發(fā)者提供強(qiáng)大的編程支持?;诂F(xiàn)代化的混合架構(gòu),結(jié)合 Rust 后端的高性能和 React/Ink 前端的交互式終端界面。oli 支持多...
閱讀原文

Ztalk.ai

Ztalk.ai 是AI桌面應(yīng)用程序,專注于實(shí)時(shí)語(yǔ)音翻譯。支持超過30種語(yǔ)言,延遲小于100毫秒,能與Zoom、Google Meet、Teams等主流視頻會(huì)議工具無(wú)縫集成。
閱讀原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級(jí)版多模態(tài)AI模型,具體版本號(hào)為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文

攻殼智能體

攻殼智能體是專注于智能體和 AI 工具的門戶網(wǎng)站,為用戶介紹最新、熱門的智能體和 AI 工具,幫助用戶快速找到適合自己的學(xué)習(xí)、工作、生活的 AI 利器。通過精...
閱讀原文

Aero-1-Audio

Aero-1-Audio 是 LMMs-Lab 開發(fā)的輕量級(jí)音頻模型,基于 Qwen-2.5-1.5B 構(gòu)建,僅包含 1.5 億參數(shù)。專為長(zhǎng)音頻處理設(shè)計(jì),能支持長(zhǎng)達(dá) 15 分鐘的連續(xù)音頻輸入,無(wú)...
閱讀原文

Spring.new

Spring.new 是基于人工智能的低代碼/無(wú)代碼構(gòu)建平臺(tái),幫助用戶快速構(gòu)建和部署定制化的商業(yè)應(yīng)用程序。通過自然語(yǔ)言輸入,用戶可以將想法轉(zhuǎn)化為實(shí)際應(yīng)用,無(wú)需...
閱讀原文

URM

URM(Universal Recommendation Model)是阿里媽媽推出的世界知識(shí)大模型,基于知識(shí)注入和信息對(duì)齊,將LLM的通用知識(shí)與電商領(lǐng)域的專業(yè)知識(shí)相結(jié)合,解決傳統(tǒng)LLM...
閱讀原文

風(fēng)宇

風(fēng)宇是中國(guó)氣象局聯(lián)合南昌大學(xué)和華為共同推出的全球首個(gè)全鏈?zhǔn)娇臻g天氣大模型。模型基于創(chuàng)新的鏈?zhǔn)接?xùn)練結(jié)構(gòu),結(jié)合衛(wèi)星觀測(cè)數(shù)據(jù)與數(shù)值模式數(shù)據(jù),實(shí)現(xiàn)太陽(yáng)風(fēng)、...
閱讀原文

Hyprnote

Hyprnote 是為會(huì)議設(shè)計(jì)的AI筆記應(yīng)用。基于實(shí)時(shí)記錄會(huì)議內(nèi)容結(jié)合用戶筆記,快速生成高質(zhì)量的會(huì)議總結(jié)。Hyprnote 支持離線使用,所有數(shù)據(jù)存儲(chǔ)在本地,確保隱私...
閱讀原文

Miras

Miras是谷歌推出的用在深度學(xué)習(xí)架構(gòu)設(shè)計(jì)的通用框架,特別是序列建模任務(wù)。Miras基于關(guān)聯(lián)記憶和注意力偏差的概念,將Transformer、現(xiàn)代線性RNN等模型重新定義...
閱讀原文
123415