標簽：基準

開源大模型王座易主！谷歌Gemma殺入場，筆記本可跑，可商用

機器之心報道機器之心編輯部剛剛，谷歌殺入開源大模型。開源領域大模型，迎來了重磅新玩家。谷歌推出了全新的開源模型系列「Gemma」。相比 Gemini，Gemma ...

閱讀原文

AIGC動態

2年前 (2024)

三年16篇一作，前谷歌研究科學家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

機器之心報道編輯：陳萍該團隊的新模型在多個基準測試中都與 Gemini Pro 、GPT-3.5 相媲美。如果你經常讀 AI 大模型方向的論文，Yi Tay 想必是一個熟悉的名...

閱讀原文

AIGC動態

2年前 (2024)

通義千問再開源，Qwen1.5帶來六種體量模型，性能超越GPT3.5

機器之心報道編輯：澤南超越 Claude、GPT-3.5，提升了多語言支持能力。趕在春節前，通義千問大模型（Qwen）的 1.5 版上線了。今天上午，新版本的消息引發了 ...

閱讀原文

AIGC動態

2年前 (2024)

擊敗OpenAI，權重、數據、代碼全開源，能完美復現的嵌入模型Nomic Embed來了

機器之心報道編輯：陳萍、小舟模型參數量只有 137M，5 天就能訓練好。一周前，OpenAI 給廣大用戶發放福利，在下場修復 GPT-4 變懶的問題后，還順道上新了 5 ...

閱讀原文

AIGC動態

2年前 (2024)

無注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

機器之心報道編輯：陳萍Eagle 7B 可將推理成本降低 10-100 倍。在 AI 賽道中，與動輒上千億參數的模型相比，最近，小模型開始受到大家的青睞。比如法國 AI ...

閱讀原文

AIGC動態

2年前 (2024)

大模型推理成本排行榜來了：賈揚清公司效率領跑

機器之心報道編輯：小舟、澤南風投燒完之后，哪些大模型創業公司會開始盈利？「大模型的 API 是個虧本買賣嗎？」隨著大語言模型技術的逐漸實用化，越來越多...

閱讀原文

AIGC動態

2年前 (2024)

OpenAI官方下場修復GPT-4變懶，上新多個模型、還大降價

機器之心報道編輯：杜偉、陳萍今天，OpenAI 一口氣宣布了 5 個新模型，包括兩個文本嵌入模型、升級的 GPT-4 Turbo 預覽版和 GPT-3.5 Turbo、一個審核模型。 ...

閱讀原文

AIGC動態

2年前 (2024)

無需訓練實現價值觀實時動態對齊：上交開源價值觀對齊方法OPO，閉源與開源大模型均適用

機器之心專欄機器之心編輯部隨著人工智能技術的發展，以 GPT-4 為代表的大語言模型依靠其強大的能力正在對社會產生深遠的影響。與此同時，大模型本身的安全...

閱讀原文

AIGC動態

2年前 (2024)

最佳開源模型刷新多項SOTA，首次超越Mixtral Instruct！「開源版GPT-4」家族迎來大爆發

新智元報道編輯：桃子【新智元導讀】Mixtral 8x7B模型開源后，AI社區再次迎來一大波微調實踐。來自Nous Research應用研究小組團隊微調出新一代大模型Nous-He...

閱讀原文

AIGC動態

2年前 (2024)

開源模型新紀錄：超越Mixtral 8x7B Instruct的模型來了

機器之心報道編輯：張倩又有新的開源模型可以用了。從 Llama、Llama 2 到 Mixtral 8x7B，開源模型的性能記錄一直在被刷新。由于 Mistral 8x7B 在大多數基準...

閱讀原文

AIGC動態

2年前 (2024)

殺瘋了的開源專家模型 Mixtral 8x7B 論文公開啦！

夕小瑤科技說原創作者 | 付奶茶、王二狗上個月法國初創公司 Mistral AI 開源的一個8x7B MoE模型Mixtral 8x7B引爆了AI社區。一是因為它的性能擊敗了LLama2和...

閱讀原文

AIGC動態

2年前 (2024)

Mixtral 8x7B論文終于來了：架構細節、參數量首次曝光

機器之心報道作者：陳萍、大盤雞Mixtral 8x7B 在大多數基準測試中都優于 Llama 2 70B 和 GPT-3.5。前段時間，那個爆火整個開源社區的 Mixtral 8x7B MoE 模型...

閱讀原文

AIGC動態

2年前 (2024)

今日最熱門AI論文Top5：高效微調、圖生3D、AI Agent、大模型ChatGPT、圖學習

夕小瑤科技說原創作者 | 賽博馬良本文整理了今日發表在ArXiv上的AI論文中最熱門的TOP5。論文熱度排序、論文標簽、中文標題、推薦理由和論文摘要均由賽博馬...

閱讀原文

AIGC動態

2年前 (2024)

8x7B MoE與Flash Attention 2結合，不到10行代碼實現快速推理

機器之心報道編輯：陳萍感興趣的小伙伴，可以跟著操作過程試一試。前段時間，Mistral AI 公布的 Mixtral 8x7B 模型爆火整個開源社區，其架構與 GPT-4 非常相...

閱讀原文

AIGC動態

2年前 (2023)

微軟發布 Orca 2 LLM，表現優于 10 倍參數模型

作者 | Anthony Alford 譯者 | 明知山策劃 | 丁曉昀微軟發布 Orca 2 LLM，這是 Llama 2 的一個調優版本，性能與包含 10 倍參數的模型相當，甚至更好。Orca...

閱讀原文

AIGC動態

2年前 (2023)

1…7 8910 11 12