標簽:智能語音助手

ima知識號

ima知識號是騰訊旗下ima推出的全新功能,為知識庫創作者提供集中發布和管理知識庫的平臺。ima知識號配備數據分析工具,創作者能直觀地查看知識庫的數量、參與...
閱讀原文

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個“思考模型”,能在回應前進行推理,提升性能和準確性。模型在多個基準測試中表現卓越,在推理和代碼生成方面...
閱讀原文

VACE

VACE(Video Creation and Editing)是阿里巴巴通義實驗室推出的一站式視頻生成與編輯框架。基于整合多種視頻任務(如參考視頻生成、視頻到視頻編輯、遮罩編...
閱讀原文

R1-Omni

R1-Omni 是阿里通義推出的基于強化學習(RLVR)的全模態大語言模型,專注于情感識別任務。通過結合視覺和音頻信息,能清晰地解釋情感識別的推理過程,展現出...
閱讀原文

靈犀 X2

靈犀X2是智元機器人推出的最新雙足人形機器人。全身擁有28個自由度,搭載小腦控制器Xyber-Edge、域控制器Xyber-DCU和智能電源管理系統Xyber-BMS,機械結構上...
閱讀原文

TicVoice 7.0

TicVoice 7.0 是出門問問推出的第七代高品質 TTS(語音合成)引擎,基于新一代語音生成模型 Spark-TTS 。TicVoice 7.0基于創新的 BiCodec 編碼方式,將語音分...
閱讀原文

Pinch

Pinch 是創新的實時 AI 語音翻譯視頻會議平臺,專為打破語言障礙而設計,支持超過 30 種語言的即時語音翻譯。提供兩種翻譯模式:口譯模式和同聲傳譯模式,分...
閱讀原文

AVD2

AVD2(Accident Video Diffusion for Accident Video Description)是清華大學聯合香港科技大學、吉林大學、南京理工大學、北京理工大學、復旦大學等機構推出...
閱讀原文

Light-R1

Light-R1是360智腦開源的AI模型,專注于數學領域的長思維鏈推理,具體為 Light-R1-32B。模型基于Qwen2.5-32B-Instruct,用7萬條數學數據和兩階段課程學習(SF...
閱讀原文

All Voice Lab

All Voice Lab(趣丸千音)是全球領先的AI語音創作平臺,提供一站式智能語音解決方案,基于趣丸科技與香港中文大學(深圳)聯合研發的MaskGCT語音大模型開發...
閱讀原文

Mercor

Mercor 是專注全球招聘的AI驅動平臺,基于AI技術簡化求職和招聘流程。求職者只需上傳簡歷,完成20分鐘的AI面試,Mercor能將用戶的信息匹配到全球數千家公司的...
閱讀原文

Long-VITA

Long-VITA 是騰訊優圖實驗室、南京大學、廈門大學開源的多模態模型,能處理超過100萬tokens的長文本輸入,在短文本任務中表現出色。Long-VITA基于分階段訓練...
閱讀原文

Sa2VA

Sa2VA是字節跳動聯合加州大學默塞德分校、武漢大學和北京大學共同推出的多模態大語言模型,是SAM2和LLaVA結合而成,能實現對圖像和視頻的密集、細粒度理解。S...
閱讀原文

YAYI-Ultra

YAYI-Ultra 是中科聞歌研發的企業級大語言模型的旗艦版本,具備強大的多領域專業能力和多模態內容生成能力。支持數學、代碼、金融、輿情、中醫、安全等多個領...
閱讀原文

Ola

Ola是清華大學、騰訊 Hunyuan 研究團隊和新加坡國立大學 S-Lab 合作開發的全模態語言模型。通過漸進式模態對齊策略,逐步擴展語言模型支持的模態,從圖像和文...
閱讀原文
12346