一個通用框架,用于在測試時調節(jié)大型推理模型的思維進度。
業(yè)界首個超大規(guī)模混合 Mamba 推理模型,強推理能力。
Steiner 是一個基于合成數據訓練的推理模型,旨在探索多種推理路徑并自主驗證。
Qwen AI是阿里巴巴推出的一款先進的推理模型,具備創(chuàng)新的“深度思考”功能。該模型基于Qwen2.5-Max架構,采用QWQ-MAX-PREVIEW技術,致力于通過復雜的推理分支和優(yōu)化路徑來解決各類挑...
一個專注于整理最佳開源推理數據集的社區(qū)項目
DeepSeek-R1-Zero 是一款通過大規(guī)模強化學習訓練的推理模型,無需監(jiān)督微調即可實現卓越推理能力。
DeepSeek-R1-Distill-Qwen-7B 是一個開源的推理模型,專注于數學、代碼和推理任務。
OpenAI o3-mini 是 OpenAI 推出的最新高性價比推理模型,專為 STEM 領域優(yōu)化。
UIGEN-T1-Qwen-7b 是一個基于 Qwen2.5-Coder-7B-Instruct 的 70 億參數模型,用于推理生成 HTML 和 CSS 基礎的 UI 組件。
Dolphin R1是一個用于訓練推理模型的數據集,包含80萬條樣本。
s1是一個基于Qwen2.5-32B-Instruct微調的推理模型,僅用1000個樣本進行訓練。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙