標簽:初始化

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

唯一答對“strawberry中有幾個r”的開源項目,被我找到了!

夕小瑤科技說 原創作者 | 海野strawberry中有幾個r OpenAI o1團隊花了半年時間教會o1 'strawberry中有幾個r',一個開源項目做對了! 這幾天,想擼代碼的心按...
閱讀原文

強化學習讓大模型自動糾錯,數學、編程性能暴漲,DeepMind新作

機器之心報道 機器之心編輯部無需依賴外部反饋或額外模型,純純的自我糾正。自我糾正(Self-correction)是大語言模型 (LLM) 非常重要的能力,但人們發現這種...
閱讀原文

KAN結合Transformer,真有團隊搞出了解決擴展缺陷的KAT

機器之心報道 編輯:小舟、陳陳Transformer 是現代深度學習的基石。傳統上,Transformer 依賴多層感知器 (MLP) 層來混合通道之間的信息。 前段時間,來自 MIT...
閱讀原文

從頭預訓練一只超迷你 LLaMA 3

直播預告 | 5月23日晚7點,「智猩猩機器人新青年講座」第6講正式開講,論文一作、清華大學在讀博士郭旭東將直播講解《大模型在具身多智能體合作中的研究進展...
閱讀原文

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果

機器之心專欄 機器之心編輯部隨著大模型的參數量日益增長,微調整個模型的開銷逐漸變得難以接受。 為此,北京大學的研究團隊提出了一種名為 PiSSA 的參數高效...
閱讀原文

超10秒高分辨率,北大Open Sora視頻生成更強了,還支持華為芯片

機器之心報道 編輯:陳萍北大團隊聯合兔展發起的 Sora 復現計劃,現在有了新成果。OpenAI 在今年年初扔出一項重大研究,Sora 將視頻生成帶入一個新的高度,很...
閱讀原文

Llama2-7B升級為Pro版本!騰訊提出「塊擴展」訓練法,效果全面提升

夕小瑤科技說 原創作者 | 付奶茶、python大語言模型在編程、數學、生物醫學和金融等專業領域性能不佳,通過特定領域后訓練可在降低資源消耗的同時提升性能。...
閱讀原文

8x7B MoE與Flash Attention 2結合,不到10行代碼實現快速推理

機器之心報道 編輯:陳萍感興趣的小伙伴,可以跟著操作過程試一試。前段時間,Mistral AI 公布的 Mixtral 8x7B 模型爆火整個開源社區,其架構與 GPT-4 非常相...
閱讀原文

LLaMA開源大模型源碼分析!

01LLaMA-Model在transformers倉庫中可以看到llama的源碼,首先是LlamaModel類,繼承自PreTrainedModel,這個類是所有模型的基類,包含了一些通用的方法,比如...
閱讀原文