標簽:模型訓練

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

PartCrafter

PartCrafter 是先進的3D生成模型,能從單張RGB圖像中生成多個語義明確且幾何形態各異的3D網格。通過組合潛在空間表示每個3D部件,使用層次化注意力機制在部件...
閱讀原文

FLUX.1 Kontext

FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進行生成與編輯,支持對象修改、風格...
閱讀原文

SpatialLM

SpatialLM 是群核科技開源的空間理解多模態模型,賦予機器人和智能系統類似人類的空間認知能力。通過分析普通手機拍攝的視頻,能重建出詳細的 3D 場景布局,...
閱讀原文

Ideogram 2a

Ideogram 2a 是 AI 圖像生成公司 Ideogram 最新發布的文生圖模型,模型在 Ideogram 2.0 的基礎上進行了優化,主打高效性和實用性,生成速度顯著提升,成本降...
閱讀原文

BioEmu

BioEmu是微軟研究院推出的生成式深度學習系統,高效模擬蛋白質的動態結構和平衡態構象。能在單個GPU上每小時生成數千種蛋白質結構樣本,效率遠超傳統的分子動...
閱讀原文

架構創新×模型創新!清微智能全面適配DeepSeek模型推理和訓練

原標題:架構創新×模型創新!清微智能全面適配DeepSeek模型推理和訓練 文章來源:新智元 內容字數:1652字國產AI芯片新突破:清微智能RPU助力大模型高效運行 ...
閱讀原文

大模型量化訓練極限在哪?騰訊混元提出低比特浮點數訓練Scaling Laws

這項研究為大模型訓練中的浮點數量化提供了重要的理論指導。
閱讀原文

MultiBooth

MultiBooth是清華大學深圳國際研究生院、 Meta、香港科技大學等機構推出的多概念圖像生成方法,能從文本中生成包含多個用戶指定概念的圖像。MultiBooth將生成...
閱讀原文

什么是合成數據(Synthetic Data)

合成數據(Synthetic Data)是一種非人工創建的數據,通過計算算法和模擬生成,用以模仿真實世界數據。它具有與實際數據相同的數學特性,但不包含相同的具體...
閱讀原文

什么是生成對抗網絡(GANs)

生成對抗網絡(GANs)是一種深度學習模型,由生成器和判別器兩部分組成,通過互相博弈學習達到數據生成的目的。生成器的任務是從隨機噪聲中生成數據,而判別...
閱讀原文

谷歌AI造芯論文遭猛烈抨擊,Jeff Dean強勢反擊學術指責!

原標題:AI造芯Nature論文遭圍攻,谷歌發文硬剛學術抹黑!Jeff Dean怒懟:你們連模型都沒訓 文章來源:新智元 內容字數:5439字谷歌回應AlphaChip質疑:科學...
閱讀原文

什么是自監督學習(Self-Supervised Learning)

自監督學習(Self-Supervised Learning)是一種機器學習技術,它使模型能從未標記的數據中學習,通過構建輔助任務生成標簽來訓練模型。自監督學習在自然語言...
閱讀原文

什么是激活函數(Activation Functions)

激活函數(Activation Functions)是深度學習中人工神經網絡神經元的非線性變換工具,引入非線性因素,使神經網絡能夠學習和執行復雜的任務。沒有激活函數,...
閱讀原文

什么是序列建模(Sequence Modeling)

序列建模(Sequence Modeling)是自然語言處理和時間序列分析中的一種建模方法,它用于處理具有序列依賴性的數據。能捕捉數據點之間的時間或順序關系,如在文...
閱讀原文
12