AI項目和框架
Phi-4-Multimodal
Phi-4-Multimodal 是微軟最新推出的多模態語言模型,擁有 56 億參數,能將語音、視覺和文本處理集成到一個統一架構中。模型在多個基準測試中表現優異,在自動...
R1-Onevision
R1-Onevision 是開源的多模態大語言模型,專注于復雜視覺推理任務。基于 Qwen2.5-VL 微調而成,通過整合視覺和文本數據,能精準地進行多模態信息解釋。在數學...
Phi-4-Mini
Phi-4-Mini 是微軟 Phi-4 系列中最新推出的專注于文本任務的小型語言模型,參數量為 38 億?;诿芗慕獯a器-only Transformer 架構,結合分組查詢注意力(G...
VideoGrain
VideoGrain 是悉尼科技大學和浙江大學推出的零樣本多粒度視頻編輯框架,能實現類別級、實例級和部件級的精細視頻修改。VideoGrain基于調節時空交叉注意力和自...
騰訊混元Turbo S
騰訊混元Turbo S是騰訊推出的新一代快思考模型。模型采用創新的Hybrid-Mamba-Transformer融合架構,有效降低了傳統Transformer的計算復雜度,減少了KV-Cache...
TinyR1-Preview
TinyR1-Preview是北京大學計算機學院與360公司聯合推出的32B參數量的推理模型。模型僅用5%的參數量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在數學領域...
AgentRefine
AgentRefine 是北京郵電大學和美團聯合提出的智能體合成框架,通過“精煉調整”(Refinement Tuning)提升基于大型語言模型(LLM)的智能體在多樣化任務中的泛...