標(biāo)簽:模型
大模型的新戰(zhàn)場(chǎng)
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自定焦(dingjiaoone)作者 | 溫故編輯 | 方展博9月5日一早,北京國(guó)貿(mào)大廈,這座北京CBD核心區(qū)曾經(jīng)的最高樓,A座一層入口處擠滿了人。兩位...
Falcon 180B 開(kāi)源影響了誰(shuí)?
中國(guó)開(kāi)源是需要一些理想主義在其中的。作者丨張 進(jìn)編輯丨陳彩嫻近日,TII研究中心推出的開(kāi)源大模型Falcon 180B一經(jīng)發(fā)布,便被認(rèn)為是當(dāng)前最好的開(kāi)源大模型。原...
英偉達(dá)新王者登場(chǎng)!GH200超級(jí)芯片碾壓H100,性能飆升17%!
夕小瑤科技說(shuō) 分享來(lái)源 | 新智元繼4月份加入LLM訓(xùn)練測(cè)試后,MLPerf再次迎來(lái)重磅更新!剛剛,MLCommons發(fā)布了MLPerf v3.1版本更新,并加入了兩個(gè)全新基準(zhǔn):LLM...
李云龍、謝耳朵專業(yè)陪聊!ChatHaruhi爆火:支持32個(gè)中外角色,開(kāi)源5.4萬(wàn)條對(duì)話數(shù)據(jù)
夕小瑤科技說(shuō) 分享來(lái)源 | 新智元作者 | LRS「角色扮演」是大型語(yǔ)言模型眾多應(yīng)用場(chǎng)景中比較有意思的,LLM可以用指定角色的口吻跟用戶對(duì)話,還可以實(shí)現(xiàn)諸如「喬...
馬毅教授新作:白盒ViT成功實(shí)現(xiàn)「分割涌現(xiàn)」,經(jīng)驗(yàn)深度學(xué)即將結(jié)束?
新智元報(bào)道編輯:LRS【新智元導(dǎo)讀】CRATE模型完全由理論指導(dǎo)設(shè)計(jì),僅用自監(jiān)督學(xué)習(xí)即可實(shí)現(xiàn)分割語(yǔ)義涌現(xiàn)。基于Transformer的視覺(jué)基礎(chǔ)模型在各種下游任務(wù),如分...
想讓大模型在prompt中學(xué)習(xí)更多示例,這種方法能讓你輸入更多字符
機(jī)器之心報(bào)道編輯:Panda W我們知道在使用 GPT 和 LLaMA 等大型語(yǔ)言模型時(shí),輸入的 prompt 存在字符數(shù)限制,比如 ChatGPT 目前的輸入字符限制是 4096 個(gè)字符...
螞蟻集團(tuán)保險(xiǎn)科技探索與實(shí)踐:AI新科技重塑保險(xiǎn)服務(wù),帶來(lái)行業(yè)新體驗(yàn)
機(jī)器之心發(fā)布機(jī)器之心編輯部保險(xiǎn)行業(yè)對(duì)于社會(huì)民生和國(guó)民經(jīng)濟(jì)的重要性不言而喻,其作為風(fēng)險(xiǎn)管理工具,為人民群眾提供保障和福利,推動(dòng)經(jīng)濟(jì)的穩(wěn)定和可持續(xù)發(fā)展...
10人倆月搞出大模型!一年16篇頂會(huì)論文加持:市面上做得好的都沒(méi)有開(kāi)源
衡宇 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI一家今年5月份成立在深圳的公司,團(tuán)隊(duì)至今不到10人。他們要做的卻不是小事:挑戰(zhàn)AGI。底氣在哪?一看過(guò)往履歷,二看...
智源:70萬(wàn)預(yù)算從頭開(kāi)發(fā)千億參數(shù)大模型,挑戰(zhàn)成功
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI預(yù)算10萬(wàn)美元(約73萬(wàn)人民幣),從頭訓(xùn)練一個(gè)全新的千億參數(shù)大模型。智源研究院與國(guó)內(nèi)多所高校及南洋理工聯(lián)合團(tuán)隊(duì)...
Google 基于 GNN 開(kāi)發(fā)氣味識(shí)別 AI,工作量相當(dāng)于人類評(píng)價(jià)員連續(xù)工作 70 年
:By 超神經(jīng)內(nèi)容一覽:氣味總是縈繞我們身邊。然而,我們卻很難對(duì)氣味準(zhǔn)確描述。最近,Google Research 的子公司 Osom 基于圖神經(jīng)網(wǎng)絡(luò),開(kāi)發(fā)了氣味分析 AI。...
大模型如何可解釋?新澤西理工學(xué)院等最新《大型語(yǔ)言模型可解釋性》綜述
來(lái)源:專知大型語(yǔ)言模型(LLMs)在自然語(yǔ)言處理方面展示了令人印象深刻的能力。然而,它們的內(nèi)部機(jī)制仍然不清楚,這種不透明性對(duì)下游應(yīng)用帶來(lái)了不希望的風(fēng)險(xiǎn)...
MIT研究人員將Transformer與圖神經(jīng)網(wǎng)絡(luò)結(jié)合,用于設(shè)計(jì)全新蛋白質(zhì)
將 ScienceAI設(shè)為星標(biāo)第一時(shí)間掌握新鮮的 AI for Science 資訊編輯 | 蘿卜皮憑借其復(fù)雜的排列和動(dòng)態(tài)功能,蛋白質(zhì)通過(guò)采用簡(jiǎn)單構(gòu)建塊的獨(dú)特排列(其中幾何形狀...
英偉達(dá)GH200芯片刷榜MLPerf;阿里首提AI驅(qū)動(dòng)為戰(zhàn)略重心;Dojo或?yàn)樘厮估瓗?lái)6000億美元增長(zhǎng)丨AIGC大事日?qǐng)?bào)
09/12全球AIGC產(chǎn)業(yè)要聞1、英偉達(dá)GH200芯片在MLPerf新測(cè)試中表現(xiàn)最佳2、英偉達(dá)的AI芯片主導(dǎo)地位或使芯片創(chuàng)企融資困難3、微軟發(fā)布13億參數(shù)phi-1.5 多步驟處理表...
9.12丨AIGC大事日?qǐng)?bào)
09/12全球AIGC產(chǎn)業(yè)要聞1、英偉達(dá)GH200芯片在MLPerf新測(cè)試中表現(xiàn)最佳2、英偉達(dá)的AI芯片主導(dǎo)地位或使芯片創(chuàng)企融資困難3、微軟發(fā)布13億參數(shù)phi-1.5 多步驟處理表...
扒一扒騰訊混元大模型“老底”
魚羊 蕭簫 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI騰訊自研混元通用大模型,終于正式在騰訊全球數(shù)字生態(tài)大會(huì)上亮相。模型亮相的同時(shí),騰訊還宣布幾大騰訊業(yè)務(wù)就已...
粵公網(wǎng)安備 44011502001135號(hào)