標(biāo)簽：架構(gòu)

獨(dú)家｜非 Transformer 開源大模型 RWKV 元始智能已完成種子輪融資

訓(xùn)練出千億模型依然是 RWKV 當(dāng)下最能證明自己的事情。作者丨張進(jìn) 編輯丨陳彩嫻 AI科技評(píng)論獨(dú)家獲悉，開源LLM RWKV背后的元始智能，種子輪融資已于1月16日走...

2年前 (2024)

對(duì)標(biāo)OpenAI GPT-4，MiniMax 國內(nèi)首個(gè) MoE 大語言模型全量上線

作者｜冬梅 1 月 16 日，InfoQ 獲悉，經(jīng)過了半個(gè)月的部分客戶的內(nèi)測和反饋，MiniMax 全量發(fā)布大語言模型 abab6，該模型為國內(nèi)首個(gè) MoE（Mixture-of-Experts）...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

HTAP 在快遞行業(yè)助力時(shí)效分析的落地實(shí)踐

本文節(jié)選自《基礎(chǔ)軟件之路 - 企業(yè)級(jí)實(shí)踐及開源之路》一書，該書集結(jié)了中國幾乎所有主流基礎(chǔ)軟件企業(yè)的實(shí)踐案例，由 28 位知名專家共同編寫，系統(tǒng)剖析了基礎(chǔ)軟...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

大模型套殼祛魅：質(zhì)疑套殼，理解套殼｜甲子光年

套殼不是核心競爭力，把殼做厚才是。作者｜趙健剛剛過去的 2023 年是大模型元年，在國產(chǎn)大模型數(shù)量狂飆突進(jìn)的同時(shí)——已經(jīng)超過 200 個(gè)，“套殼”一直是縈繞在大...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

「喚醒」NPC，這家融資過億的國內(nèi)創(chuàng)企在做一種很新的游戲

機(jī)器之心報(bào)道編輯：張倩、陳萍每次進(jìn)入游戲，NPC 都說著不一樣的臺(tái)詞，這將是一個(gè)怎樣的世界？在眾多游戲類型中，開放世界游戲是非常受歡迎的一種，因?yàn)樗?..

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

華為改進(jìn)Transformer架構(gòu)！盤古-π解決特征缺陷問題，同規(guī)模性能超LLaMA

明敏發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI華為盤古系列，帶來架構(gòu)層面上新！量子位獲悉，華為諾亞方舟實(shí)驗(yàn)室等聯(lián)合推出新型大語言模型架構(gòu)：盤古-π。它通過...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

你沒有看過的全新版本，Transformer數(shù)學(xué)原理揭秘

機(jī)器之心報(bào)道編輯：趙陽近日，arxiv 上發(fā)布了一篇論文，對(duì) Transformer 的數(shù)學(xué)原理進(jìn)行全新解讀，內(nèi)容很長，知識(shí)很多，十二分建議閱讀原文。2017 年，Vaswan...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

挑戰(zhàn)Transformer，華為諾亞新架構(gòu)盤古π來了，已有1B、7B模型

機(jī)器之心專欄機(jī)器之心編輯部5 年前，Transformer 在國際神經(jīng)信息處理大會(huì) NeurIPS 2017 發(fā)表，后續(xù)其作為核心網(wǎng)絡(luò)架構(gòu)被廣泛用于自然語言處理和計(jì)算機(jī)視覺等...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

誰能撼動(dòng)Transformer統(tǒng)治地位？Mamba作者談LLM未來架構(gòu)

機(jī)器之心編譯機(jī)器之心編輯部自 2017 年被提出以來，Transformer 已成為 AI 大模型的主流架構(gòu)，未來這種情況是一直持續(xù)，還是會(huì)有新的研究出現(xiàn)，我們不妨先聽...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

大模型被偷家！騰訊港中文新研究修正認(rèn)知：CNN搞多模態(tài)不弱于Transfromer

騰訊&港中文團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI在Transformer占據(jù)多模態(tài)工具半壁江山的時(shí)代，大核CNN又“殺了回來”，成為了一匹新的黑馬。騰訊AI實(shí)驗(yàn)室與港...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

讓大模型操縱無人機(jī)，北航團(tuán)隊(duì)提出具身智能新架構(gòu)

趙浩然投稿量子位 | 公眾號(hào) QbitAI進(jìn)入多模態(tài)時(shí)代，大模型也會(huì)操縱無人機(jī)了！只要視覺模塊捕捉到啟動(dòng)條件，大模型這個(gè)“大腦”就會(huì)生成動(dòng)作指令，接著無人機(jī)便...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

戴瓊海院士：開源后在 AlpacaEval 直追 GPT4，零一靠技術(shù)如何重建生態(tài)信心

來源：AI科技大本營斯坦福大學(xué)研發(fā)的大語言模型評(píng)測 AlpacaEval Leaderboard 備受業(yè)內(nèi)認(rèn)可，在 2023 年 12 月 7 日更新的排行榜中，Yi-34B-Chat 以 94.08% ...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

?丟掉注意力的擴(kuò)散模型：Mamba帶火的SSM被蘋果、康奈爾盯上了

機(jī)器之心報(bào)道機(jī)器之心編輯部替代注意力機(jī)制，SSM 真的大有可為？為了用更少的算力讓擴(kuò)散模型生成高分辨率圖像，注意力機(jī)制可以不要，這是康奈爾大學(xué)和蘋果的...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

進(jìn)入蘋果最神秘的芯片實(shí)驗(yàn)室，回顧蘋果歷代CPU構(gòu)架，展現(xiàn)3萬億公司成長之路

新智元報(bào)道編輯：alan 潤【新智元導(dǎo)讀】蘋果創(chuàng)造了資本主義歷史上最成功的產(chǎn)品，成為第一家市值達(dá)到1萬億美元的企業(yè)。讓我們一起探究蘋果最神秘的芯片研發(fā)部...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

上云還是下云：章文嵩博士解讀真正的云原生 Kafka 十倍降本方案！

作者｜章文嵩、周新宇策劃 | Tina近日，AutoMQ 團(tuán)隊(duì)發(fā)布了基于云的開源云原生 Kafka——AutoMQ for Kafka，所有的代碼采用 Apache 2.0 開源許可。AutoMQ 充分...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

1…9 101112 13 14