標(biāo)簽:模型
LLM實(shí)踐系列-詳談Tokenizer訓(xùn)練細(xì)節(jié)
今天給大家?guī)碇魼真中合歡的一篇文章,《LLM實(shí)踐--Tokenizer訓(xùn)練》。 知乎:https://zhuanlan.zhihu.com/p/739078635 經(jīng)過了數(shù)據(jù)收集、篩選、去重,馬上就...
李開復(fù)回應(yīng)AI六小虎困境:有資金訓(xùn)練模型,融資、芯片都不是問題;阿里稱新AI翻譯工具擊敗谷歌和ChatGPT丨AI情報(bào)局
要聞提示1.零一萬物新旗艦?zāi)P?Yi-Lightning 首度超越 GPT-4o,李開復(fù)回應(yīng)AI六小虎困境傳言:融資、芯片都不是問題 2.阿里巴巴國際部門稱新AI翻譯工具擊敗谷...
沖出“包圍圈”,階躍星辰登頂國內(nèi)多模態(tài)理解大模型榜首
說起階躍星辰,可以說是 AI 六小強(qiáng)中最低調(diào)的一個(gè),但最近這家公司在 AI 圈里頻頻“鬧出動(dòng)靜”。 前幾天,中文大模型基準(zhǔn)測(cè)評(píng)機(jī)構(gòu) SuperCLUE 發(fā)布了 10 月中文...
最強(qiáng)小模型又易主!Mistral發(fā)布小部長(zhǎng)Ministral 3B、8B,邊緣計(jì)算之王!
夕小瑤科技說 原創(chuàng)作者 | 付奶茶家人們,就在今天,Mistral 7B發(fā)布一周年之際,小模型的寶座又易主了! Mistral研究團(tuán)隊(duì)發(fā)布了兩款新的邊緣計(jì)算小模型:Minis...
從威爾?史密斯鬼畜吃面到「Her」,這些幕后技術(shù)正在推動(dòng)AI視頻時(shí)代的到來
機(jī)器之心原創(chuàng) 作者:張倩還記得「威爾?史密斯吃意大利面」的 AI 鬼畜視頻嗎?在這些視頻里,威爾?史密斯的面部表情、動(dòng)作都非常夸張,還充滿了扭曲、變形。...
英偉達(dá)開源最新大模型Nemotron 70B后,只有OpenAI o1一個(gè)對(duì)手了
機(jī)器之心報(bào)道 編輯:杜偉、陳陳英偉達(dá)不僅要做顯卡領(lǐng)域的領(lǐng)先者,還要在大模型領(lǐng)域逐漸建立起自己的優(yōu)勢(shì)。今天,英偉達(dá)又開源了一個(gè)性能超級(jí)強(qiáng)大的模型 —— Ll...
全模態(tài)對(duì)齊框架align-anything來了:實(shí)現(xiàn)跨模態(tài)指令跟隨
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
NeurIPS 2024 | FaceChain團(tuán)隊(duì)新作,開源拓?fù)鋵?duì)齊人臉表征模型TopoFR
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
2 美元就能用上 H100? 英偉達(dá) H100 價(jià)格崩盤,集群投資血虧:GPU 生意還怎么玩下去?
作者 | Eugene Cheah 譯者 | 核子可樂 策劃 | 褚杏娟 就在去年,H100 GPU 的每小時(shí)租賃價(jià)格還高達(dá) 8 美元。可現(xiàn)如今,不單可選的租賃商更加豐富,市場(chǎng)平均價(jià)...
零一萬物發(fā)布最新旗艦?zāi)P停偃f token 僅 0.99 元!李開復(fù):定價(jià)沒有虧本
作者 | 褚杏娟 10 月 16 日,繼上半年千億參數(shù)模型 Yi-Large 之后,零一萬物正式對(duì)外發(fā)布最新旗艦?zāi)P?Yi-Lightning。與 Yi-Large 相比,Yi-Lightning 在模...
52萬張GPU集群塞進(jìn)一個(gè)「盒子」?AI神器百模爭(zhēng)霸困局!
新智元報(bào)道編輯:編輯部 HYZ 【新智元導(dǎo)讀】「算力」堪稱是AI時(shí)代最大的痛。在國外,OpenAI因?yàn)槲④浽霨PU集群的速度太慢而算力告急。在國內(nèi),企業(yè)則面臨著「...
英偉達(dá)開源新王!70B刷爆SOTA,擊敗GPT-4o只服OpenAI o1
新智元報(bào)道編輯:編輯部 HYZ 【新智元導(dǎo)讀】就在剛剛,英偉達(dá)開源了超強(qiáng)模型Nemotron-70B,后者一經(jīng)發(fā)布就超越了GPT-4o和Claude 3.5 Sonnet,僅次于OpenAI o1...
4090筆記本0.37秒直出大片!英偉達(dá)聯(lián)手MIT清華祭出Sana架構(gòu),速度秒殺FLUX
新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】一臺(tái)4090筆記本,秒生1K質(zhì)量高清圖。英偉達(dá)聯(lián)合MIT清華團(tuán)隊(duì)提出的Sana架構(gòu),得益于核心架構(gòu)創(chuàng)新,具備了驚人的圖像...
不敢對(duì)比阿里Qwen2.5,Mistral“最強(qiáng)小模型”陷爭(zhēng)議,歐洲的OpenAI也不Open了
夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI歐洲的OpenAI,也不Open了。 Mistral AI發(fā)布自稱“世界上最好的邊緣模型”,卻陷入質(zhì)疑和爭(zhēng)議。 不僅因?yàn)檫@一次沒有磁...
LeCun最新萬字演講:純語言模型永遠(yuǎn)到不了人類水平,我們基本已經(jīng)放棄了
白小交 整理自 凹非寺量子位 | 公眾號(hào) QbitAI當(dāng)奧特曼、馬斯克、Anthropic CEO都紛紛將AGI實(shí)現(xiàn)錨定在2026年前后,LeCun無疑是直接澆了冷水:完全是胡說八道。...
粵公網(wǎng)安備 44011502001135號(hào)