標簽:性能
人大高瓴提出“注意力波”方法,70 億參數 Llama 比肩 GPT-4
夕小瑤科技說 原創作者 | 智商掉了一地、python最近,隨著大型語言模型(LLM)在人機交互、多模態任務和語言應用等領域的廣泛應用,研究者們紛紛致力于提升這...
ChatGPT一:開源語言大模型的沖擊
自2022年末發布后,ChatGPT給人工智能的研究和商業領域帶來了巨大變革。通過有監督微調和人類反饋的強化學習,模型可以回答人類問題,并在廣泛的任務范圍內遵...
CMU 最新研究:Gemini 綜合不敵 ChatGPT,谷歌還需努力
研究結果表明,Gemini 綜合性能難敵 ChatGPT 。作者丨王 悅 編輯丨陳彩嫻 最近谷歌發布的 Gemini 格外引人注目,其號稱是第一個在各種任務中可與 OpenAI 的 C...
ChatGPT不再懶惰,GPT-4.5傳聞引關注
點擊上方藍字關注我們“OpenAI正對GPT-4進行調整,解決性能問題,并重新開放ChatGPT Plus訂閱。有傳言稱GPT-4.5已秘密推出,但CEO否認。用戶反饋GPT-4異常行為...
英特爾第五代至強可擴展處理器發布,在CPU上跑AI更香了
金磊 豐色 發自 凹非寺量子位 | 公眾號 QbitAI千呼萬喚始出來,第五代英特爾?至強?可擴展處理器,它來了! 若是用一句話來概括它的特點,那就是——AI味道越發...
推理性能超H100十倍!21歲華裔小哥哈佛輟學開發AI加速芯片「Sohu」,2人公司估值3400萬刀
新智元報道編輯:潤 好困 【新智元導讀】最近,兩位哈佛輟學生共同創立的AI芯片公司,估值已達3400萬美元,并計劃明年交付一款名為「Sohu」的AI推理加速芯片—...
PaLM 2數學性能暴漲6%!DeepMind新作力證「合成數據」是通往AGI關鍵
新智元報道編輯:桃子【新智元導讀】AI可以從自己生成的「合成數據」中學習,最重要的是,能夠大幅提升數據問題解決和代碼生成的能力。合成數據,或許就是大...
微軟推出2.7B「小語言模型」,碾壓Gemini Nano,能打Llama 2 70B
大模型現在真的是越來越卷了!11月OpenAI先是用GPTs革了套殼GPT們的命,然后再不惜獻祭董事會搏了一波天大的流量。谷歌被逼急了,趕在年底之前倉促發布了超大...
2.7B能打Llama 2 70B,微軟祭出「小語言模型」!96塊A100 14天訓出Phi-2,碾壓谷歌Gemini nano
新智元報道編輯:潤 alan【新智元導讀】都快到年底了,大模型領域還在卷,今天,Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手,甚至還能和L...
微軟小模型擊敗大模型:27億參數,手機就能跑
機器之心報道編輯:杜偉、小舟在「小搏大」這條技術發展路線上,微軟一直在前進。上個月,微軟 CEO 納德拉在 Ignite 大會上宣布自研小尺寸模型 Phi-2 將完全...
最新開源模型Mixtral震爆AI社區!超越LLama2和GPT-3.5,來自歐洲初創公司
夕小瑤科技說 原創作者 | 松果、王二狗這兩天,法國初創公司Mistral AI開源的一個Mixtral 8x7B MoE模型引爆了AI社區。一是因為它的性能擊敗了LLama2和GPT-3.5...
22人估值20億美元,半年增長七倍,“歐洲 OpenAI”發布媲美GPT3.5的“開放權重”模型
編輯 | Tina Mistral AI 是一家總部位于巴黎的初創公司,由 Meta 和谷歌的研究人員于七個月前創立。目前,該公司已成功籌集 3.85 億歐元(約合 4.15 億美元...
2024年AI趨勢看這張圖,LeCun:開源大模型要超越閉源
機器之心報道編輯:大盤雞、澤南能感受到其中的趨勢嗎?2023 年即將過去。一年以來,各式各樣的大模型爭相發布。當 OpenAI 和谷歌等科技巨頭正在角逐時, —— ...
性能超越GPT-3.5:Mistral 8x7B是目前最好的開源 LLM
點擊上方藍字關注我們“ 歐洲初創公司Mistral最新發布Mixtral 8x7B,采用獨特“專家混合”技術,介紹展示了該模型性能超越GPT-3.5和Llama 2系列。同時,該公司完...
訓練成本不到其 6% 的「聯邦大模型」,憑什么在會議場景媲美 GPT-4?
「三個臭皮匠,頂個諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月,在雷峰網于新加坡舉辦的 GAIR 大會主論壇上,前微軟全球技術院士、美國雙院院士黃學東用一...
粵公網安備 44011502001135號