PosterCraft
PosterCraft是香港科技大學(廣州)和美團等機構推出的用在生成高質量美學海報的統(tǒng)一框架。框架摒棄模塊化設計流程和固定的預定義布局,支持模型自由探索連貫...
RAG-Anything
RAG-Anything是香港大學數據智能實驗室推出的開源多模態(tài)RAG系統(tǒng)。系統(tǒng)支持處理包含文本、圖像、表格和公式的復雜文檔,提供從文檔攝取到智能查詢的端到端解決...
元智醫(yī)療大模型
元智醫(yī)療大模型是聯影智能推出的面向醫(yī)療領域的多模態(tài)人工智能模型,通過融合文本、影像、視覺、語音等多種模態(tài)數據,為醫(yī)療場景提供深度智能化解決方案。
Stream-Omni
Stream-Omni是中國科學院計算技術研究所智能信息處理重點實驗室、中國科學院人工智能安全重點實驗室及中國科學院大學聯合推出的類似GPT-4o的大型語言視覺語音...
Kimi-Researcher
Kimi-Researcher 是月之暗面旗下的 Kimi 推出的基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,專為深度研究任務而設計。能...
Self Forcing
Self Forcing 是 Adobe Research 與德克薩斯大學奧斯汀分校聯合推出的新型自回歸視頻生成算法,解決傳統(tǒng)生成模型在訓練與測試時的暴露偏差問題。通過在訓練階...