PromptEnhancer
PromptEnhancer是騰訊混元團隊開源的用在提升文本到圖像(T2I)模型的提示重寫框架,通過思維鏈(Chain-of-Thought,CoT)提示重寫和專用的獎勵模型AlignEval...
MasterGo Agent
MasterGo Agent是MasterGo AI推出的全球首個數字界面生產級AI Agent,支持基于設計系統(DSM)的文生UI,能調用團隊已有設計規范,實現高效協作和生產。
Nano Bananary
Nano Bananary(香蕉超市) 是開源的圖像編輯工具,基于 Google Gemini 圖像模型開發,支持中文界面和明暗主題切換,提供 50 多種圖像轉換效果,無需復雜提示...
數說Social Research
數說Social Research 是數說故事旗下的全能營銷 Agent 工具,依托領先大模型技術,接入海量社交媒體數據,能快速解答營銷、市場、消費者口碑等專業問題并生成...
Bilibili發布IndexTTS2語音模型:情感與時長可控的語音合成技術突破!
今天要聊的主角是——Bilibili的IndexTTS2語音模型。作為一款專為語音合成設計的AI工具,IndexTTS2自2025年發布以來,已經迅速吸引了大量關注,特別是在情感控...
螞蟻集團在2025Inclusion·外灘大會上正式發布全球首個智能眼鏡可信連接技術框架— gPass
如今,AI眼鏡被不少人看作是下一代智能終端的潛力股,市場潛力肉眼可見。但仔細觀察就會發現,這個行業還處在起步階段,面臨著不少讓人頭疼的問題。清華大學...
跨境支付難題:塔塔支付科技如何賦能亞洲數字商務新生態
引言:亞洲支付市場的黃金時代 2025年,亞洲數字支付市場正經歷著前所未有的變革浪潮。印度數字支付市場預計到2030年將達到9580億美元,年復合增長率高達18.5...
InfiniteTalk
InfiniteTalk是美團視覺智能部推出的新型數字人驅動技術,通過稀疏幀video dubbing范式,僅需少量關鍵幀能驅動數字人人生成自然流暢的視頻,解決傳統技術中口...
清華炸場!AI 大模型天梯榜來了,選模型不再頭禿。
周六在杭州有一個 GOSIM 大會。這個大會上,清華大學聯合中軟評測中心發布了《2025 大模型服務性能排行榜》。這個排行榜挺有意思的,它不是對比各個 AI 大模...
GPT-5-Codex 發布,可以7小時連續編程,但OpenAI 封殺了API。。
凌晨一點,OpenAI 發布了 GPT-5-Codex,但這次,所有想調用 API 的開發者可能要失望了。OpenAI 做了一個決定:Codex 并不通過 API 開放。你不能靠 key 來偷偷...
Lumina-DiMOO
Lumina-DiMOO是上海人工智能實驗室等機構開源的新一代多模態生成與理解模型。模型采用全離散擴散架構,統一處理文本、圖像等多模態數據,支持文本到圖像生成...
UnifoLM-WMA-0
UnifoLM-WMA-0 是宇樹科技開源的跨多類機器人本體的世界模型 - 動作架構,專為通用機器人學習設計。核心是世界模型,能理解機器人與環境的物理交互,具備仿真...