標簽：張量

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經常用來日常寫作，雖然本身提供了AI功能，但可惜需要會員，本文教你三分鐘接入最火的DeepSeek，讓WPS秒變辦公神器。 DeepSeek API申請地址：http:/...

閱讀原文

AI教程

8個月前

AI賺錢副業~AI生成影視解說，半個月漲粉變現3.5W+！

這兩年大家都在感嘆生活不易，然而我想說的是，機會還是有的，但問題不在于有沒有，而在于你是否能夠認準機會，然后抓住它。接觸過很多咨詢項目的人，發現...

使用教程

12個月前

專家模型不要專家并行！微軟開源MoE新路徑

新智元報道編輯：alan 【新智元導讀】近日，來自微軟的研究人員開源了使用全新方法訓練的MoE大模型，不走尋常路，且編碼和數學表現出色。繼Phi家族之后，微軟...

閱讀原文

AIGC動態

11個月前

從圖像到視頻：淺談Video Diffusion Models背后的底層原理

01前言最近一段時間恰好在推進手上的一個做視頻生成相關的課??題，也是對視頻擴散模型（Video Diffusion Models）這一領域有了頗多認識。其中，視頻擴散模型...

閱讀原文

AIGC動態

12個月前

「乘法變加法」！MIT清華校友全新方法優化Transformer：Addition is All You Need

新智元報道編輯：喬楊好困【新智元導讀】Transformer計算，竟然直接優化到乘法運算了。MIT兩位華人學者近期發表的一篇論文提出：Addition is All You Need...

閱讀原文

AIGC動態

12個月前

一行代碼訓練成本再降30%，AI大模型混合精度訓練再升級｜開源

允中發自凹非寺量子位 | 公眾號 QbitAIFP8通過其獨特的數值表示方式，能夠在保持一定精度的同時，在大模型訓練中提高訓練速度、節省內存占用，最終降低訓練...

閱讀原文

AIGC動態

1年前 (2024)

TensorRT-LLM保姆級教程（一）-快速入門

隨著大模型的爆火，投入到生產環境的模型參數量規模也變得越來越大（從數十億參數到千億參數規模），從而導致大模型的推理成本急劇增加。因此，市面上也出現...

閱讀原文

AIGC動態

1年前 (2024)

如果大不是有史以來的第一次，那是什么導致了它發生？

來源：科技世代千高原許多持反對態度的人對宇宙膨脹的發生提出質疑。但證據表明事實并非如此。不斷膨脹的宇宙充滿了星系和我們今天觀察到的復雜結構，它起...

閱讀原文

AIGC動態

1年前 (2024)

Llama3訓練每3小時崩一次？豆包大模型、港大團隊為脆皮萬卡訓練提效

機器之心發布機器之心編輯部伴隨大模型迭代速度越來越快，訓練集群規模越來越大，高頻率的軟硬件故障已經成為阻礙訓練效率進一步提高的痛點，檢查點（Checkp...

閱讀原文

AIGC動態

1年前 (2024)

GPU訓Llama 3.1瘋狂崩潰，竟有大廠用CPU服務器跑千億參數大模型？

新智元報道編輯：編輯部【新智元導讀】是時候用CPU通用服務器跑千億參數大模型了！馬斯克19天建成由10萬塊H100串聯的世界最大超算，已全力投入Grok 3的訓練...

閱讀原文

AIGC動態

1年前 (2024)

斯坦福博士圖解AlphaFold 3：超多細節+可視化還原ML工程師眼中的AF3

新智元報道編輯：喬楊庸庸【新智元導讀】AlphaFold 3的論文太晦澀？沒關系，斯坦福大學的兩位博士生「圖解」AlphaFold 3 ，將模型架構可視化，同時不遺漏任...

閱讀原文

AIGC動態

1年前 (2024)

只激活3.8B參數，性能比肩同款7B模型！訓練微調都能用，來自微軟

克雷西發自凹非寺量子位 | 公眾號 QbitAI只需激活60%的參數，就能實現與全激活稠密模型相當的性能。微軟亞洲研究院的一項新研究，實現了模型的完全稀疏激...

閱讀原文

AIGC動態

1年前 (2024)

參數少80%，效果仍超LoRA！上交大&上海AI Lab推出高效微調框架FLoRA

Huiser 投稿量子位 | 公眾號 QbitAI為了讓大模型在特定任務、場景下發揮更大作用，LoRA這樣能夠平衡性能和算力資源的方法正在受到研究者們的青睞。然而，以L...

閱讀原文

AIGC動態

1年前 (2024)

AI真·煉丹：整整14天，無需人類參與

金磊夢晨發自凹非寺量子位 | 公眾號 QbitAI現在制藥這事，人類要靠邊站了。坐標蘇州，這是一個1600平的制藥實驗室，它的“打開方式”是這樣的：門口，沒有...

閱讀原文

AIGC動態

1年前 (2024)

史上最快AI芯片「Sohu」，速度10倍于B200，哈佛輟學生打造

機器之心報道編輯：澤南、杜偉生成式 AI 推理性價比是 GPU 的 140 倍。大模型時代，全球都缺算力，買鏟子的英偉達市值被炒上了天。現在，終于有一家公司帶...

閱讀原文

AIGC動態

1年前 (2024)

大模型壓縮量化方案怎么選？無問芯穹Qllm-Eval量化方案全面評估：多模型、多參數、多維度

機器之心發布作者：李師堯（無問芯穹TechView）基于 Transformer架構的大型語言模型在各種基準測試中展現出優異性能，但數百億、千億乃至萬億量級的參數規模...

閱讀原文

AIGC動態

1年前 (2024)

這個團隊做了OpenAI沒Open的技術，開源OpenRLHF讓對齊大模型超簡單

機器之心報道編輯：Panda隨著大型語言模型（LLM）規模不斷增大，其性能也在不斷提升。盡管如此，LLM 依然面臨著一個關鍵難題：與人類的價值和意圖對齊。在解...

閱讀原文

AIGC動態

1年前 (2024)

12 3