標簽:架構
Attention isn’t all you need!Mamba混合大模型開源:三倍Transformer吞吐量
機器之心報道 編輯:小舟Mamba 時代來了? 自 2017 年開創性研究論文《Attention is All You Need》問世以來,transformer 架構就一直主導著生成式人工智能領...
Mamba超強進化體一舉顛覆Transformer!單張A100跑140K上下文
新智元報道編輯:編輯部 【新智元導讀】52B的生產級Mamba大模型來了!這個超強變體Jamba剛剛打破世界紀錄,它能正面硬剛Transformer,256K超長上下文窗口,吞...
Databricks發布DBRX:性能超ChatGPT,為當前最強大開源模型
點擊上方藍字關注我們“Databricks推出DBRX,一款1320億參數的開源AI模型,性能超越GPT-3.5。采用創新“專家混合”架構,DBRX在語言理解、編程和數學基準測試中...
誰將替代 Transformer?
非 Transformer 面臨的共同考驗依然是證明自己的天花板有多高。作者丨張進 編輯丨陳彩嫻 2017年谷歌發表的論文《Attention Is All You Need》成為當下人工智...
史上最強 AI 芯片,到底強在哪?
這兩天,我們再次回顧了黃仁勛在 GTC 2024 上的演講,在對產品做更深一層的分析解讀時,發現了一些當時熬夜忽略掉的亮點。 一是老黃的演講風格,幽默、自然、...
蘇媽現身北京,AMD喊出了AI PC Yes!
機器之心報道 作者:澤南面對生成式 AI 時代,AMD 已經準備好了一套從云到端的全方位算力體系。 這一次,蘇姿豐來到國內,宣告了 AI PC 時代的到來。3 月 21 ...
英偉達B200打破摩爾定律!老黃順便公開GPT-4的秘密
夢晨 克雷西 發自 凹非寺量子位 | 公眾號 QbitAI整個AI圈最想知道的秘密,被老黃在PPT某頁的小字里寫出來了? 時隔兩年,英偉達官宣新一代Blackwell架構,為A...
老黃炸場!深夜發布全球最強芯片B200!推理速度提升30倍
夕小瑤科技說 分享來源 | 量子位 AI春晚GTC開幕,皮衣老黃再次燃爆全場。 時隔兩年,英偉達官宣新一代Blackwell架構,定位直指“新工業革命的引擎” ,“把AI擴...
英偉達吞噬世界!新架構超級GPU問世,AI算力一步提升30倍
機器之心報道 機器之心編輯部「這才是我理想中的 GPU。」—— 黃仁勛。「這不是演唱會。你們是來參加開發者大會的!」老黃出場時,現場爆發出了巨大的歡呼聲。 ...
比 Sora DiT 架構早兩個月的 U-ViT,由這家中國 AIGC 公司提出
CVPR2023 曾拒稿 OpeanAI 的 DiT,收錄生數科技的 U-ViT。作者丨王悅 編輯丨陳彩嫻 「Sora 出來之后,團隊就開始連軸轉,沒休息過。」這是 AI 科技評論了解到...
清華系多模態大模型公司剛剛融了數億元!放話“今年達到Sora效果”
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI清華系多模態大模型公司,又拿錢了! 生數科技,師出清華朱軍團隊,是國內最早布局多模態大模型的團隊之一。 市場消...
Figure簡歷數量暴漲218%;阿里云成立聯盟推進大模型應用;批準1030億盧比AI項目丨AIGC大事日報
03/08 全球AIGC產業要聞 1、Inflection-2.5用40%計算量實現近GPT-4性能 2、谷歌新API實現手機PC大模型端側運行 3、OpenAI CTO被曝是罷免事件關鍵人物 4、印度...
OpenAI調查結果將公示;創企一年前已發類Sora架構;Meta將推出巨型視頻推薦模型丨AIGC大事日報
03/07 全球AIGC產業要聞 1、OpenAI將任命新董事 公示CEO罷免調查結果 2、曝創企一年前已發類Sora架構 3、智源提出通用計算機控制智能體框架Cradle 4、零一萬...
比亞迪 168 萬的仰望 U9 ,給了中國超跑一個答案
仰望 U9 另一種 超跑邏輯關于中國人自己造超跑這件事,我們總是懷著復雜的感情,既期待,又害怕。 期待的是,希望有車企能夠摘下汽車工業王冠上的寶石,飛馳...
國內公司有望做出Sora嗎?這支清華系大模型團隊給出了希望
機器之心原創 作者:張倩在 Sora 代表的視頻生成路線上,國內公司其實已有一定的技術儲備。2023 年年底,很多人都預測,未來一年將是視頻生成快速發展的一年...