標簽:基準
開源大模型王座易主!谷歌Gemma殺入場,筆記本可跑,可商用
機器之心報道 機器之心編輯部剛剛,谷歌殺入開源大模型。 開源領域大模型,迎來了重磅新玩家。 谷歌推出了全新的開源模型系列「Gemma」。相比 Gemini,Gemma ...
三年16篇一作,前谷歌研究科學家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5
機器之心報道 編輯:陳萍該團隊的新模型在多個基準測試中都與 Gemini Pro 、GPT-3.5 相媲美。 如果你經常讀 AI 大模型方向的論文,Yi Tay 想必是一個熟悉的名...
通義千問再開源,Qwen1.5帶來六種體量模型,性能超越GPT3.5
機器之心報道 編輯:澤南超越 Claude、GPT-3.5,提升了多語言支持能力。趕在春節前,通義千問大模型(Qwen)的 1.5 版上線了。今天上午,新版本的消息引發了 ...
擊敗OpenAI,權重、數據、代碼全開源,能完美復現的嵌入模型Nomic Embed來了
機器之心報道 編輯:陳萍、小舟模型參數量只有 137M,5 天就能訓練好。一周前,OpenAI 給廣大用戶發放福利,在下場修復 GPT-4 變懶的問題后,還順道上新了 5 ...
無注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
機器之心報道 編輯:陳萍Eagle 7B 可將推理成本降低 10-100 倍。在 AI 賽道中,與動輒上千億參數的模型相比,最近,小模型開始受到大家的青睞。比如法國 AI ...
OpenAI官方下場修復GPT-4變懶,上新多個模型、還大降價
機器之心報道 編輯:杜偉、陳萍今天,OpenAI 一口氣宣布了 5 個新模型,包括兩個文本嵌入模型、升級的 GPT-4 Turbo 預覽版和 GPT-3.5 Turbo、一個審核模型。 ...
大模型推理成本排行榜來了:賈揚清公司效率領跑
機器之心報道 編輯:小舟、澤南風投燒完之后,哪些大模型創業公司會開始盈利? 「大模型的 API 是個虧本買賣嗎?」隨著大語言模型技術的逐漸實用化,越來越多...
無需訓練實現價值觀實時動態對齊:上交開源價值觀對齊方法OPO,閉源與開源大模型均適用
機器之心專欄 機器之心編輯部隨著人工智能技術的發展,以 GPT-4 為代表的大語言模型依靠其強大的能力正在對社會產生深遠的影響。與此同時,大模型本身的安全...
最佳開源模型刷新多項SOTA,首次超越Mixtral Instruct!「開源版GPT-4」家族迎來大爆發
新智元報道編輯:桃子 【新智元導讀】Mixtral 8x7B模型開源后,AI社區再次迎來一大波微調實踐。來自Nous Research應用研究小組團隊微調出新一代大模型Nous-He...
開源模型新紀錄:超越Mixtral 8x7B Instruct的模型來了
機器之心報道 編輯:張倩又有新的開源模型可以用了。 從 Llama、Llama 2 到 Mixtral 8x7B,開源模型的性能記錄一直在被刷新。由于 Mistral 8x7B 在大多數基準...
殺瘋了的開源專家模型 Mixtral 8x7B 論文公開啦!
夕小瑤科技說 原創作者 | 付奶茶、王二狗上個月法國初創公司 Mistral AI 開源的一個8x7B MoE模型Mixtral 8x7B引爆了AI社區。 一是因為它的性能擊敗了LLama2和...
Mixtral 8x7B論文終于來了:架構細節、參數量首次曝光
機器之心報道 作者:陳萍、大盤雞Mixtral 8x7B 在大多數基準測試中都優于 Llama 2 70B 和 GPT-3.5。前段時間,那個爆火整個開源社區的 Mixtral 8x7B MoE 模型...
今日最熱門AI論文Top5:高效微調、圖生3D、AI Agent、大模型ChatGPT、圖學習
夕小瑤科技說 原創作者 | 賽博馬良本文整理了今日發表在ArXiv上的AI論文中最熱門的TOP5。 論文熱度排序、論文標簽、中文標題、推薦理由和論文摘要均由賽博馬...
8x7B MoE與Flash Attention 2結合,不到10行代碼實現快速推理
機器之心報道 編輯:陳萍感興趣的小伙伴,可以跟著操作過程試一試。前段時間,Mistral AI 公布的 Mixtral 8x7B 模型爆火整個開源社區,其架構與 GPT-4 非常相...
微軟發布 Orca 2 LLM,表現優于 10 倍參數模型
作者 | Anthony Alford 譯者 | 明知山 策劃 | 丁曉昀 微軟發布 Orca 2 LLM,這是 Llama 2 的一個調優版本,性能與包含 10 倍參數的模型相當,甚至更好。Orca...