標簽:自然語言理解

Phi-3

Phi-3是微軟研究院推出的新一代系列先進的小語言模型,包括phi-3-mini、phi-3-small和phi-3-medium三個不同規模的版本。這些模型在保持較小的參數規模的同時...
閱讀原文

混元DiT

混元DiT(Hunyuan-DiT)是由騰訊混元團隊開發的一款高性能的文本到圖像的擴散Transformer模型,具備細粒度的中英文理解能力,能夠根據文本提示生成多分辨率的...
閱讀原文

SAM 2

SAM 2(Segment Anything Model 2)是Meta推出的AI對象分割模型,專注于實時圖像和視頻對象分割。具備零樣本泛化能力,能準確分割未知對象,并通過統一架構同...
閱讀原文

Mini-Monkey

Mini-Monkey是華中科技大學和華南理工大學聯合推出的輕量級多模態AI模型。采用多尺度自適應切分策略(MSAC)和尺度壓縮機制(SCM),有效解決了傳統圖像切分...
閱讀原文

Llama-3.1-Minitron

Llama-3.1-Minitron是由英偉達和Meta合作開發的AI模型,通過剪枝和知識蒸餾技術從Llama 3.1 8B模型精煉而成的更小型4B參數模型。這種優化減少了模型大小和復...
閱讀原文

Ugic

Ugic是即時設計推出的Figma AI設計插件,能根據用戶上傳的組件庫和設計系統,智能生成多語言的UI草稿。Ugic支持文本到結構的轉換,允許用戶輸入PRD或描述文本...
閱讀原文

Yodayo

Yodayo是一個面向動漫愛好者和虛擬主播(VTubers)的在線AI藝術創作平臺。用戶可以通過輸入提示詞和選擇模型,輕松生成高質量的動漫風格藝術作品。
閱讀原文

PGTFormer

PGTFormer是先進的視頻人臉修復框架,通過解析引導的時間一致性變換器來恢復視頻中的高保真細節,同時增強時間連貫性。該方法無需預對齊,基于語義解析選擇最...
閱讀原文

什么是思維鏈(Chain of Thought,CoT)

思維鏈(Chain of Thought,CoT)是人工智能領域的一項突破性進展,通過模擬人類解決問題時的思考過程,賦予機器更深層次的邏輯推理能力。在面對需要多步驟邏...
閱讀原文

人工超級智能(Artificial Superintelligence,ASI)

人工超級智能(Artificial Superintelligence,ASI)是一種理論上的人工智能系統,認知能力遠超人類智能。不僅能執行所有人類能夠完成的智能任務,而且能以更...
閱讀原文

Claude Dev

Claude Dev是一個集成在Visual Studio Code中的AI編程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,為開發者提供自動化的編程支持。Claude Dev自動處理...
閱讀原文

Qwen2.5

Qwen2.5 是阿里通義千問團隊最新開源的最強AI大模型,具有多種參數規模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在預訓練時使用了最新的大規...
閱讀原文

Toorch

Toorch是由零一萬物推出的一款AI新聞閱讀器,旨在提供高效、個性化的移動搜索體驗。支持連續對話功能,形成時間線結構,方便用戶追蹤和回顧歷史對話。
閱讀原文

LVCD

LVCD(Large Video Color Diffusion)是一個專為動畫視頻線稿上色設計的視頻擴散框架,能將黑白線稿自動轉化為彩色動畫視頻。LVCD使用了一種先進的擴散模型,...
閱讀原文

豆包Seaweed

豆包Seaweed是字節跳動推出的AI視頻生成模型,支持文生視頻和圖生視頻兩種模式。基于Transformer結構,利用時空壓縮技術進行訓練,原生支持多分辨率輸出,適...
閱讀原文
13456