PhonicMind:智能音樂分離平臺(tái)助你輕松提取人聲、鼓、貝斯及樂器音軌
PhonicMind是在線AI音樂處理平臺(tái),專注于從歌曲中提取和分離人聲、樂器等音頻元素。基于先進(jìn)的AI技術(shù),為用戶提供精確的人聲移除和音樂隔離功能,支持制作卡...
360 推出國產(chǎn)自研 AI 大模型,多項(xiàng)評(píng)測(cè)優(yōu)于GPT-4o
360gpt2-o1 是 360 自研的 AI 大模型,在推理能力上有顯著提升,特別是在數(shù)學(xué)和邏輯推理任務(wù)上表現(xiàn)出色。模型通過合成數(shù)據(jù)優(yōu)化、模型后訓(xùn)練和“慢思考”范式實(shí)...
騰訊微信推出的多模態(tài)大模型
POINTS 1.5 是騰訊微信發(fā)布的多模態(tài)大模型,是POINTS 1.0的升級(jí)版本。 模型繼續(xù)沿用了POINTS 1.0中的LLaVA架構(gòu),由一個(gè)視覺編碼器、一個(gè)投影器和一個(gè)大型語言...
Slides Orator:AI驅(qū)動(dòng)的虛擬解說平臺(tái)實(shí)現(xiàn)幻燈片內(nèi)容的即時(shí)生動(dòng)呈現(xiàn)
Slides Orator是創(chuàng)新的AI平臺(tái),基于創(chuàng)建虛擬形象實(shí)時(shí)展示幻燈片進(jìn)行解說。工具基于技術(shù)生成語音旁白,讓演示內(nèi)容動(dòng)態(tài)地與觀眾互動(dòng),增強(qiáng)演示的吸引力和參與度...
Step-1o:國內(nèi)首個(gè)千億參數(shù)端到端語音大模型震撼發(fā)布,性提升語音識(shí)別與合成能力
Step-1o是階躍星辰推出的國內(nèi)首個(gè)千億參數(shù)端到端語音大模型。模型支持語音、文本等混合形式的輸入和輸出,可以快速反應(yīng)并隨時(shí)打斷,提供最便捷的互動(dòng)體驗(yàn);同...
Pika 2.0:Pika Labs全新AI視頻生成工具助力創(chuàng)作者輕松制作高質(zhì)量視頻內(nèi)容
Pika 2.0是Pika Labs推出的AI視頻生成工具,在前代產(chǎn)品的基礎(chǔ)上進(jìn)行了重大更新,提供了更多的用戶控制和定制化功能。Pika 2.0的核心特性包括改進(jìn)的文本對(duì)齊和...
DeepSeek最新開源的MoE視覺語言模型系列
DeepSeek-VL2是DeepSeek最新開源的一系列大型混合專家(Mixture-of-Experts,簡(jiǎn)稱MoE)視覺語言模型,在前代 DeepSeek-VL 的基礎(chǔ)上進(jìn)行了顯著改進(jìn)。DeepSeek-...
OpenAI最新推出的AI項(xiàng)目管理工具
ChatGPT Projects是OpenAI最新推出的集成多項(xiàng)實(shí)用工具的新功能,提升了用戶的工作效率。Projects支支持用戶上傳各種文件,增強(qiáng)ChatGPT對(duì)話的深度與針對(duì)性。可...
在線AI圖像生成器,高級(jí)自定義設(shè)置負(fù)面提示和模型選擇
BYLO AI是免費(fèi)的在線AI圖像生成器,用戶能用簡(jiǎn)單的文本提示快速生成高質(zhì)量的圖像。BYLO AI支持包括Flux模型在內(nèi)的多種模型,BYLO AI提供靈活的圖像設(shè)置,包括...
AI驅(qū)動(dòng)的自動(dòng)轉(zhuǎn)錄、翻譯和字幕平臺(tái)
SONIX是先進(jìn)的AI驅(qū)動(dòng)的自動(dòng)轉(zhuǎn)錄、翻譯和字幕平臺(tái),能將音頻和視頻文件快速準(zhǔn)確地轉(zhuǎn)換,支持49種語言的轉(zhuǎn)錄和50種語言的翻譯,提供瀏覽器內(nèi)編輯器,支持用戶直...
Insight-V:多模態(tài)模型提升長(zhǎng)鏈視覺推理能力的創(chuàng)新解決方案
Insight-V是南洋理工大學(xué)、騰訊公司和清華大學(xué)的研究者們共同推出的多模態(tài)模型,能提升多模態(tài)大型語言模型在長(zhǎng)鏈視覺推理方面的能力。基于可擴(kuò)展的數(shù)據(jù)生成流...
SVDQuant:高效擴(kuò)散模型后訓(xùn)練量化技術(shù)提升AI性能與推理速度
SVDQuant是MIT研究團(tuán)隊(duì)推出的后訓(xùn)練量化技術(shù),針對(duì)擴(kuò)散模型,將模型的權(quán)重和激活值量化至4位,減少內(nèi)存占用加速推理過程。SVDQuant引入高精度的低秩分支吸收...
Meta 推出控制數(shù)字智能體動(dòng)作的人工智能模型
Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙體驗(yàn)的真實(shí)性。Meta Motivo基于控制虛擬人形智能體的全身動(dòng)作,模擬人類行為,增強(qiáng)用戶互動(dòng)。模型采用無...
VirtualFit:智能虛擬試衣助手實(shí)現(xiàn)多功能換衣與圖像恢復(fù)擴(kuò)展
VirtualFit是創(chuàng)新的AI虛擬試衣工具,基于人工智能技術(shù)讓用戶能輕松更換服裝、恢復(fù)圖像細(xì)節(jié)和擴(kuò)展圖像大小。用戶只需上傳照片,可選擇不同的服裝樣式,AI會(huì)自...
微軟推出的14B參數(shù)小語言模型,擅長(zhǎng)數(shù)學(xué)等領(lǐng)域的復(fù)雜推理
Phi-4是微軟推出的14億參數(shù)小型語言模型,在數(shù)學(xué)等領(lǐng)域的復(fù)雜推理以及傳統(tǒng)語言處理方面表現(xiàn)出色。Phi-4用數(shù)據(jù)質(zhì)量為核心訓(xùn)練重點(diǎn),大量融入合成數(shù)據(jù),提升模...