標簽:性能
重磅!Mistral Large 2深夜發布!Llama3.1僅一天被超越,最強開源再易主
夕小瑤科技說 原創作者 | 海野 第一次開源模型革命,突然就興起了…… Llama3.1發布后,Meta還沉浸在強烈的社會反響中時,法國的Mistral AI團隊突然扔出王炸:...
減輕幻覺新SOTA,7B模型自迭代訓練效果超越GPT-4,上海AI lab發布
夕小瑤科技說 原創作者 | 謝年年 LLMs在回答各種復雜問題時,有時會“胡言亂語”,產生所謂的幻覺。解決這一問題的初始步驟就是創建高質量幻覺數據集訓練模型以...
開源模型超過最強閉源模型,Llama 3.1能否顛覆AI生態?|甲子光年
扎克伯格誓要把開源進行到底。作者|蘇霍伊 編輯|趙健Llama 3.1終于來了。 美國當地時間7月23日,Meta正式發布Llama 3.1。其包含8B、70B 和405B三個規模,最...
大模型風向變了,OpenAI蘋果掉頭布陣
大模型邁入“小而強”時代。 作者|ZeR0 編輯|漠影 生成式AI似乎有個隱形規律:每隔一段時間,就會上演一場令人瞠目的大型“撞車”事件。 僅是今年,就有谷歌Gemin...
挑戰Scaling Law,Meta發布移動端350M小模型MobileLLM,性能比肩7B LLaMA-v2
新智元報道編輯:喬楊 【新智元導讀】Scaling Law還沒走到盡頭,「小模型」逐漸成為科技巨頭們的追趕趨勢。Meta最近發布的MobileLLM系列,規模甚至降低到了1B...
夏天太熱怎么辦?AI 為“降溫”材料發現提速數千倍,你的手機、電腦或許再也不發燙了
大數據文摘受權轉載自學術頭條 炎炎夏日,智能手機、平板電腦等電子設備常因“過熱”而產生性能、安全問題。如何設計出散熱更好的電子產品,材料是關鍵。 而其...
英偉達Mistral AI聯袂出擊!120億小模型王者強勢登場,碾壓Llama 3單張4090可跑
新智元報道編輯:耳朵 桃子 【新智元導讀】GPT-4o mini頭把交椅還未坐熱,Mistral AI聯手英偉達發布12B參數小模型Mistral Nemo,性能趕超Gemma 2 9B和Llama 3...
Redmi K70 至尊版體驗:它是性能的至尊版,還是全能的超大杯
從性能旗艦 到全能旗艦在雷軍年度演講的前一天,K70 至尊版就發布了。 和 K60 至尊版的更新模式相同,Redmi K70 至尊版搭載了聯發科最新的天璣 9300+ 處理器...
LLama+Mistral+…+Yi=? 免訓練異構大模型集成學習框架DeePEn來了
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
奧特曼深夜發動價格戰,GPT-4o mini暴跌99%!清華同濟校友立功,GPT-3.5退役
新智元報道編輯:編輯部 【新智元導讀】GPT-4o mini深夜忽然上線,OpenAI終于開卷小模型!每百萬輸入token已達15美分的超低價,跟GPT-3相比,兩年內模型成本...
上海AI lab開源LLaMAX,用3.5萬小時的A100訓練讓大模型掌握上百種語言翻譯
夕小瑤科技說 原創作者 | Richard 在這個AI大爆發的時代,各種智能工具如雨后春筍般涌現,大語言模型的能力也在不斷刷新我們的認知。隨便拉出一個AI模型,似...
ACL 2024 | 對25個開閉源模型數學評測,GPT-3.5-Turbo才勉強及格
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只需激活60%的參數,就能實現與全激活稠密模型相當的性能。 微軟亞洲研究院的一項新研究,實現了模型的完全稀疏激...
Mamba一作再祭神作,H100利用率飆至75%!FlashAttention三代性能翻倍,比標準注意力快16倍
新智元報道編輯:編輯部 【新智元導讀】時隔一年,FlashAttention又推出了第三代更新,專門針對H100 GPU的新特性進行優化,在之前的基礎上又實現了1.5~2倍的...
大語言模型的前世今生:萬字長文完整梳理所有里程碑式大語言模型(LLMs)
點擊下方卡片,關注“AI生成未來” >>后臺回復“GAI”,免費獲取AI行業報告和資料! 作者:APlayBoy編輯:AI生成未來 鏈接:https://zhuanlan.zhihu.com/p/...
粵公網安備 44011502001135號