標(biāo)簽:詞表
WPS接入DeepSeek,秒變辦公神器!
WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址:http:/...
AI賺錢副業(yè)~AI生成影視解說,半個(gè)月漲粉變現(xiàn)3.5W+!
這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會(huì)還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...
LLM實(shí)踐系列-詳談Tokenizer訓(xùn)練細(xì)節(jié)
今天給大家?guī)碇魼真中合歡的一篇文章,《LLM實(shí)踐--Tokenizer訓(xùn)練》。 知乎:https://zhuanlan.zhihu.com/p/739078635 經(jīng)過了數(shù)據(jù)收集、篩選、去重,馬上就...
NeurIPS 2024 | 大模型的詞表大小,同樣適用于Scaling Law
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
GPT-4o不會(huì)數(shù)r,被外國(guó)小哥原地逼瘋! 谷歌論文揭秘Transformer「數(shù)不到n」
新智元報(bào)道編輯:Aeneas 好困 【新智元導(dǎo)讀】提示工程師Riley Goodside小哥,依然在用「Strawberry里有幾個(gè)r」折磨大模型們,GPT-4o在無(wú)限次PUA后,已經(jīng)被原...
LLama+Mistral+…+Yi=? 免訓(xùn)練異構(gòu)大模型集成學(xué)習(xí)框架DeePEn來了
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
AI讀論文新神器:多欄密集文字、中英圖文混排文檔都能讀的多模態(tài)大模型Fox|曠視
Fox團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI雖然多模態(tài)大模型都能挑西瓜了,但理解復(fù)雜文檔方面還是差點(diǎn)意思。 面對(duì)文字密集、多欄混排等文檔時(shí)往往力不從心,區(qū)域級(jí)...
單模型斬獲「蛋白質(zhì)突變預(yù)測(cè)」榜一!西湖大學(xué)提出基于結(jié)構(gòu)詞表方法 | ICLR 2024 Spotlight
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】Saprot在proteingym蛋白質(zhì)突變預(yù)測(cè)任務(wù)公開基準(zhǔn)榜(由牛津大學(xué)計(jì)算機(jī)與哈佛醫(yī)學(xué)院設(shè)立)排名第一。相比,其他排名靠前的...
4000萬(wàn)蛋白結(jié)構(gòu)訓(xùn)練,西湖大學(xué)開發(fā)基于結(jié)構(gòu)詞表的蛋白質(zhì)通用大模型,已開源
將ScienceAI設(shè)為星標(biāo) 第一時(shí)間掌握 新鮮的AI for Science資訊編輯 |ScienceAI 蛋白質(zhì)結(jié)構(gòu)相比于序列往往被認(rèn)為更加具有信息量,因?yàn)槠渲苯記Q定了蛋白質(zhì)的功能...
年輕人的第一個(gè)多模態(tài)大模型:1080Ti輕松運(yùn)行,已開源在線可玩
Vary-toy團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI一款名為Vary-toy的“年輕人的第一個(gè)多模態(tài)大模型”來了! 模型大小不到2B,消費(fèi)級(jí)顯卡可訓(xùn)練,GTX1080ti 8G的老顯卡...
OCR終結(jié)了?曠視提出支持文檔級(jí)OCR的多模態(tài)大模型,支持中英文,已開源!
國(guó)科大&曠視團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI想將一份文檔圖片轉(zhuǎn)換成Markdown格式? 以往這一任務(wù)需要文本識(shí)別、布局檢測(cè)和排序、公式表格處理、文本清洗...
詞表的選擇如何影響語(yǔ)言模型訓(xùn)練?這可能是目前見過最好的詞表選擇研究
機(jī)器之心報(bào)道編輯:趙陽(yáng)本文初步探討了不同類型的詞表對(duì)語(yǔ)言模型訓(xùn)練所產(chǎn)生的影響,研究者使用了 12 個(gè)小型的語(yǔ)言模型及 4 個(gè)中型的語(yǔ)言模型作為實(shí)驗(yàn)對(duì)象,并...
中文LLaMA-2刷榜,開源可商用!千元預(yù)算,訓(xùn)練半天,效果媲美主流大模型
新智元報(bào)道編輯:好困 桃子【新智元導(dǎo)讀】最強(qiáng)中文版LLaMA-2來了!15小時(shí)訓(xùn)練,僅需數(shù)千元算力,性能碾壓同級(jí)中文漢化模型,開源可商用。LLaMA-2相較于LLaMA-...
15小時(shí)、幾千元訓(xùn)完中文版LLaMA2!低成本方案全面開源,包含代碼權(quán)重,支持商用
明敏 發(fā)自 凹非寺量子位 公眾號(hào) | QbitAI訓(xùn)練大模型,幾千塊就能實(shí)現(xiàn)了!現(xiàn)在,15小時(shí)、幾千塊錢、85億 token數(shù)據(jù),即可訓(xùn)出中文LLaMA2。綜合性能達(dá)到開源社...
千元預(yù)算半天訓(xùn)練,效果媲美主流大模型,開源可商用中文LLaMA-2
機(jī)器之心發(fā)布機(jī)器之心編輯部LLaMA-2 相較于 LLaMA-1,引入了更多且高質(zhì)量的語(yǔ)料,實(shí)現(xiàn)了顯著的性能提升,全面允許商用,進(jìn)一步激發(fā)了開源社區(qū)的繁榮,拓展了...
粵公網(wǎng)安備 44011502001135號(hào)