標簽:多語言支持

RAGEN

RAGEN是開源的強化學習框架,用于在交互式、隨機環境中訓練大型語言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)...
閱讀原文

Skywork-R1V 2.0

Skywork-R1V 2.0 是昆侖萬維最新開源的多模態推理模型,專為復雜推理任務設計,具備強大的視覺與文本推理能力。模型基于混合強化學習和多模態獎勵模型(Skywo...
閱讀原文

Flex.2-preview

Flex.2-preview 是Ostris開源的 80 億參數文本到圖像擴散模型,支持通用控制輸入(如線條、姿態、深度)和內置修復功能。模型基于一個模型滿足多種創意需求,...
閱讀原文

UFO2

UFO2 是微軟推出的面向 Windows 桌面的多Agent操作系統(AgentOS),基于深度系統集成和自然語言交互實現復雜桌面任務的自動化。UFO2基于中央 HostAgent 分解...
閱讀原文

企鵝讀伴

企鵝讀伴是騰訊SSV數字支教實驗室推出基于騰訊混元大模型和騰訊元器平臺提供技術支持的AI閱讀助手,專為中小學生設計。企鵝讀伴依托《義務教育語文課程方案和...
閱讀原文

Suna

Suna 是Kortix推出的全球首款通用型 AI Agent 開源項目,支持高效解決現實場景中的各類任務。基于自然流暢的對話交互,Suna 支持智能輔助研究分析、數據處理...
閱讀原文

WriteHERE

WriteHERE是Jürgen Schmidhuber領銜的團隊開源的AI長文寫作框架。WriteHERE基于異質遞歸規劃(Heterogeneous Recursive Planning)技術,動態分解寫作任務為...
閱讀原文

MAGI-1

MAGI-1 是 Sand AI 開源的全球首個自回歸視頻生成大模型,采用自回歸架構,通過逐塊預測視頻序列生成流暢自然的視頻,支持無限擴展和一鏡到底的長視頻生成。
閱讀原文

Gemma 3 QAT

Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代開源模型,是Gemma 3 的量化優化版本。通過量化感知訓練技術,Gemma 3 QAT 在顯著降低內存...
閱讀原文

CapWords

CapWords 是創新的語言學習應用,通過 AI 技術讓用戶能隨時隨地學習新單詞。用拍照功能,將生活中的物品轉化為學習內容,識別物體并提供對應的外語單詞、發音...
閱讀原文

Fellou

Fellou 是 AI 智能體初創公司 Fellou AI 推出的全球首個 Agentic(行動型)瀏覽器。具備傳統瀏覽器的信息瀏覽功能,能智能執行復雜任務,將繁瑣的點擊操作轉...
閱讀原文

Aqua Voice

Aqua Voice 是AI語音驅動的文檔編輯工具。Aqua Voice支持將語音轉換為文本,且支持用自然語言指令對文本進行編輯和格式化,如刪除、重述、格式調整等。Aqua V...
閱讀原文

Conbrie

Conbrie 是全場景一站式 AI 創作與學習交流平臺,通過人工智能技術簡化知識獲取與學習過程。提供多種功能,包括 AI 知識卡片創建、系統化知識整理、AI 文檔解...
閱讀原文

iFable

iFable 是動漫角色為主題的互動角色扮演游戲平臺。iFable支持用戶用簡單的創意輸入,生成沉浸式的互動故事游戲和冒險體驗。游戲基于AI技術讓角色根據玩家的選...
閱讀原文

EAP Talk

EAP Talk 是基于AI技術的英語口語測評應用,專注于學術英語(EAP)的學習與練習。基于大數據、語音識別、自然語言處理等技術,為學生提供實時自動打分和智能...
閱讀原文
167891061