標(biāo)簽：開(kāi)銷(xiāo)

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經(jīng)常用來(lái)日常寫(xiě)作，雖然本身提供了AI功能，但可惜需要會(huì)員，本文教你三分鐘接入最火的DeepSeek，讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址：http:/...

閱讀原文

AI教程

7個(gè)月前

AI賺錢(qián)副業(yè)~AI生成影視解說(shuō)，半個(gè)月漲粉變現(xiàn)3.5W+！

這兩年大家都在感嘆生活不易，然而我想說(shuō)的是，機(jī)會(huì)還是有的，但問(wèn)題不在于有沒(méi)有，而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì)，然后抓住它。接觸過(guò)很多咨詢(xún)項(xiàng)目的人，發(fā)現(xiàn)...

使用教程

11個(gè)月前

突破無(wú)規(guī)則稀疏計(jì)算邊界，編譯框架CROSS數(shù)倍提升模型性能

AIxiv專(zhuān)欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年，機(jī)器之心AIxiv專(zhuān)欄接收?qǐng)?bào)道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室，有效促進(jìn)了學(xué)術(shù)...

閱讀原文

AIGC動(dòng)態(tài)

10個(gè)月前

一起理解下LLM的推理流程

本文來(lái)源自Pytorch Conference 2024的talking —— Understanding the LLM Inference Workload，由NVIDIA的高級(jí)解決方案架構(gòu)師講述，感興趣的可以看原演講視頻...

閱讀原文

AIGC動(dòng)態(tài)

11個(gè)月前

清華開(kāi)源混合精度推理系統(tǒng)MixQ，實(shí)現(xiàn)大模型近無(wú)損量化并提升推理吞吐

PACMAN實(shí)驗(yàn)室投稿量子位 | 公眾號(hào) QbitAI一鍵部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清華大學(xué)計(jì)算機(jī)系PACMAN實(shí)驗(yàn)室發(fā)布開(kāi)源混合精度推理系統(tǒng)——M...

閱讀原文

AIGC動(dòng)態(tài)

11個(gè)月前

COLING24｜自適應(yīng)剪枝讓多模態(tài)大模型加速2-3倍，哈工大等推出SmartTrim

機(jī)器之心專(zhuān)欄機(jī)器之心編輯部基于 Transformer 結(jié)構(gòu)的視覺(jué)語(yǔ)言大模型（VLM）在各種下游的視覺(jué)語(yǔ)言任務(wù)上取得了巨大成功，但由于其較長(zhǎng)的輸入序列和較多的參數(shù)...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

ICLR 2024 Oral | 三行代碼，即插即用！NUS尤洋團(tuán)隊(duì)新作—InfoBatch，無(wú)損數(shù)據(jù)集動(dòng)態(tài)剪枝加速

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自將門(mén)創(chuàng)投本文介紹來(lái)自NUS尤洋團(tuán)隊(duì)的最新科研成果 - InfoBatch。這是首篇關(guān)于無(wú)損數(shù)據(jù)剪枝加速的工作，覆蓋分類(lèi)、分割、檢測(cè)、圖片生成...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2024)

全球哄搶H100！英偉達(dá)成GPU霸主，首席科學(xué)家揭秘成功四要素

新智元報(bào)道編輯：桃子潤(rùn)【新智元導(dǎo)讀】英偉達(dá)首席科學(xué)家揭秘英偉達(dá)GPU能如此成功的4個(gè)主要原因，4個(gè)關(guān)鍵數(shù)據(jù)帶來(lái)持續(xù)的行業(yè)競(jìng)爭(zhēng)力。如今的英偉達(dá)，穩(wěn)坐GPU霸...

閱讀原文

AIGC動(dòng)態(tài)

2年前 (2023)

12 3…19,098