標簽：性能

人大高瓴提出“注意力波”方法，70 億參數 Llama 比肩 GPT-4

夕小瑤科技說原創作者 | 智商掉了一地、python最近，隨著大型語言模型（LLM）在人機交互、多模態任務和語言應用等領域的廣泛應用，研究者們紛紛致力于提升這...

閱讀原文

AIGC動態

2年前 (2023)

ChatGPT一：開源語言大模型的沖擊

自2022年末發布后，ChatGPT給人工智能的研究和商業領域帶來了巨大變革。通過有監督微調和人類反饋的強化學習，模型可以回答人類問題，并在廣泛的任務范圍內遵...

閱讀原文

AIGC動態

2年前 (2023)

CMU 最新研究：Gemini 綜合不敵 ChatGPT，谷歌還需努力

研究結果表明，Gemini 綜合性能難敵 ChatGPT 。作者丨王悅編輯丨陳彩嫻最近谷歌發布的 Gemini 格外引人注目，其號稱是第一個在各種任務中可與 OpenAI 的 C...

閱讀原文

AIGC動態

2年前 (2023)

ChatGPT不再懶惰，GPT-4.5傳聞引關注

點擊上方藍字關注我們“OpenAI正對GPT-4進行調整，解決性能問題，并重新開放ChatGPT Plus訂閱。有傳言稱GPT-4.5已秘密推出，但CEO否認。用戶反饋GPT-4異常行為...

閱讀原文

AIGC動態

2年前 (2023)

英特爾第五代至強可擴展處理器發布，在CPU上跑AI更香了

金磊豐色發自凹非寺量子位 | 公眾號 QbitAI千呼萬喚始出來，第五代英特爾?至強?可擴展處理器，它來了！若是用一句話來概括它的特點，那就是——AI味道越發...

閱讀原文

AIGC動態

2年前 (2023)

推理性能超H100十倍！21歲華裔小哥哈佛輟學開發AI加速芯片「Sohu」，2人公司估值3400萬刀

新智元報道編輯：潤好困【新智元導讀】最近，兩位哈佛輟學生共同創立的AI芯片公司，估值已達3400萬美元，并計劃明年交付一款名為「Sohu」的AI推理加速芯片—...

閱讀原文

AIGC動態

2年前 (2023)

PaLM 2數學性能暴漲6%！DeepMind新作力證「合成數據」是通往AGI關鍵

新智元報道編輯：桃子【新智元導讀】AI可以從自己生成的「合成數據」中學習，最重要的是，能夠大幅提升數據問題解決和代碼生成的能力。合成數據，或許就是大...

閱讀原文

AIGC動態

2年前 (2023)

微軟推出2.7B「小語言模型」，碾壓Gemini Nano，能打Llama 2 70B

大模型現在真的是越來越卷了！11月OpenAI先是用GPTs革了套殼GPT們的命，然后再不惜獻祭董事會搏了一波天大的流量。谷歌被逼急了，趕在年底之前倉促發布了超大...

閱讀原文

AIGC動態

2年前 (2023)

2.7B能打Llama 2 70B，微軟祭出「小語言模型」！96塊A100 14天訓出Phi-2，碾壓谷歌Gemini nano

新智元報道編輯：潤 alan【新智元導讀】都快到年底了，大模型領域還在卷，今天，Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手，甚至還能和L...

閱讀原文

AIGC動態

2年前 (2023)

微軟小模型擊敗大模型：27億參數，手機就能跑

機器之心報道編輯：杜偉、小舟在「小搏大」這條技術發展路線上，微軟一直在前進。上個月，微軟 CEO 納德拉在 Ignite 大會上宣布自研小尺寸模型 Phi-2 將完全...

閱讀原文

AIGC動態

2年前 (2023)

22人估值20億美元，半年增長七倍，“歐洲 OpenAI”發布媲美GPT3.5的“開放權重”模型

編輯｜ Tina Mistral AI 是一家總部位于巴黎的初創公司，由 Meta 和谷歌的研究人員于七個月前創立。目前，該公司已成功籌集 3.85 億歐元（約合 4.15 億美元...

閱讀原文

AIGC動態

2年前 (2023)

2024年AI趨勢看這張圖，LeCun：開源大模型要超越閉源

機器之心報道編輯：大盤雞、澤南能感受到其中的趨勢嗎？2023 年即將過去。一年以來，各式各樣的大模型爭相發布。當 OpenAI 和谷歌等科技巨頭正在角逐時， —— ...

閱讀原文

AIGC動態

2年前 (2023)

性能超越GPT-3.5：Mistral 8x7B是目前最好的開源 LLM

點擊上方藍字關注我們“ 歐洲初創公司Mistral最新發布Mixtral 8x7B，采用獨特“專家混合”技術，介紹展示了該模型性能超越GPT-3.5和Llama 2系列。同時，該公司完...

閱讀原文

AIGC動態

2年前 (2023)

訓練成本不到其 6% 的「聯邦大模型」，憑什么在會議場景媲美 GPT-4？

「三個臭皮匠，頂個諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月，在雷峰網于新加坡舉辦的 GAIR 大會主論壇上，前微軟全球技術院士、美國雙院院士黃學東用一...

閱讀原文

AIGC動態

2年前 (2023)

1…18 192021 22…26

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

標簽：性能

人大高瓴提出“注意力波”方法，70 億參數 Llama 比肩 GPT-4

ChatGPT一：開源語言大模型的沖擊

CMU 最新研究：Gemini 綜合不敵 ChatGPT，谷歌還需努力

ChatGPT不再懶惰，GPT-4.5傳聞引關注

英特爾第五代至強可擴展處理器發布，在CPU上跑AI更香了

推理性能超H100十倍！21歲華裔小哥哈佛輟學開發AI加速芯片「Sohu」，2人公司估值3400萬刀

PaLM 2數學性能暴漲6%！DeepMind新作力證「合成數據」是通往AGI關鍵

微軟推出2.7B「小語言模型」，碾壓Gemini Nano，能打Llama 2 70B

2.7B能打Llama 2 70B，微軟祭出「小語言模型」！96塊A100 14天訓出Phi-2，碾壓谷歌Gemini nano

微軟小模型擊敗大模型：27億參數，手機就能跑

最新開源模型Mixtral震爆AI社區！超越LLama2和GPT-3.5，來自歐洲初創公司

22人估值20億美元，半年增長七倍，“歐洲 OpenAI”發布媲美GPT3.5的“開放權重”模型

2024年AI趨勢看這張圖，LeCun：開源大模型要超越閉源

性能超越GPT-3.5：Mistral 8x7B是目前最好的開源 LLM

訓練成本不到其 6% 的「聯邦大模型」，憑什么在會議場景媲美 GPT-4？