標簽:自然語言處理

EXAONE 3.0

EXAONE 3.0是LG AI Research推出的開源AI模型,具有7.8億參數,專為英語和韓語設計。EXAONE 3.0在英語和韓語的語言測試中均表現優異,在真實用例和數學編碼方...
閱讀原文

MDT-A2G

MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用于根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算機能更加生動和...
閱讀原文

ASAM

ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI圖像分割模型,通過對抗性調整來增強原有SAM模型的性能。ASAM用自然對抗性示例...
閱讀原文

Falcon Mamba 7B

Falcon Mamba 7B是阿聯酋技術創新研究所(TII)推出的開源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用編碼器-解碼器結構和多頭注意...
閱讀原文

醒藍AI

醒藍AI是一款AI照片生成工具,支持一鍵生成AI形象照,用戶能夠輕松制作工作形象照、寫真照、證件照和AI換臉照片。醒藍AI還提供API接口和定制化解決方案,滿足...
閱讀原文

Gemini Live

Gemini Live是谷歌推出的智能語音助手,具有自然語言理解和多模態識別能力,支持圖像、視頻和語音交互。用戶可通過語音指令控制,實現日常任務自動化。Gemini...
閱讀原文

Mureka

Mureka是昆侖萬維推出的 AI 音樂商用創作平臺,讓專業藝術家和音樂愛好者能在平臺上創作個性化音樂。用戶在Mureka頁面輸入歌詞,添加參考音樂,用Style功能控...
閱讀原文

Grok-2

Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、編程和推理能力。在學術基準測試中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等領域的表現超越了前代Grok-1...
閱讀原文

曉象

曉象是光啟慧語推出的AI克隆產品,基于自研可信大模型,創建各領域知識博主的AI分身。模擬知識博主的聲音、風格和表達方式,生成個性化的內容。
閱讀原文

Buzz

Buzz是一款基于OpenAI Whisper模型構建的離線語音轉文字工具,適用于Windows、macOS和Linux系統。Buzz能將麥克風輸入或音頻、視頻文件實時轉換為文字,支持多...
閱讀原文

Cradle

Cradle是面向通用計算機控制(General Computer Control, GCC)的多模態AI Agent框架,由昆侖萬維攜手北京智源人工智能研究院、新加坡南洋理工大學、北京大學...
閱讀原文

AI Scientist

AI Scientist是Sakana AI推出的首個全自動科學發現AI系統。能獨立完成從創意生成、編碼、實驗執行到撰寫科學論文的整個研究流程。
閱讀原文

DeepSeek-Prover-V1.5

DeepSeek-Prover-V1.5是由DeepSeek團隊開發的開源數學大模型,擁有70億參數。模型通過結合強化學習(RLPAF)和蒙特卡洛樹搜索(特別是RMaxTS變體),在數學定...
閱讀原文

SadTalker

SadTalker是西安交通大學、騰訊AI實驗室和螞蟻集團聯合推出的開源AI數字人項目。SadTalker專注于通過單張人臉圖像和語音音頻,利用3D運動系數生成逼真的說話...
閱讀原文

GigaBody

GigaBody是一款專為男性用戶推出的AI一鍵增肌應用,讓用戶輕松獲得健美身材。通過濾鏡技術,能在用戶上傳的照片中添加逼真的肌肉,膚色和光線處理自然,細節...
閱讀原文
1474849505167