標(biāo)簽:成本
大模型算力的「熱」與 10 億萬卡成本的「冷」思考
大模型原生應(yīng)用仍未爆發(fā),誰能cover動輒10億/年的萬卡成本?作者丨郭 思 編輯丨陳彩嫻 人工智能的快速發(fā)展催生了智算中心這個概念。自 2023 年下半年起,中國...
降本增效,并不只有一條路|甲子光年
采購數(shù)字化如何成為企業(yè)“降本增效”驅(qū)動力?臨近年底,不少媒體在盤點(diǎn)這一年時,“降本增效”依然是關(guān)鍵詞之一。 市場大環(huán)境變化下,企業(yè)的運(yùn)營理念正在從上升周...
Mistral攜微軟引爆「小語言模型」潮!Mistral中杯代碼能力完勝GPT-4,成本暴降2/3
新智元報道編輯:Aeneas【新智元導(dǎo)讀】小模型的風(fēng)潮,最近愈來愈盛,Mistral和微軟分別有所動作。而網(wǎng)友實(shí)測發(fā)現(xiàn),Mistral-medium的代碼能力竟然完勝了GPT-4...
訓(xùn)練成本不到其 6% 的「聯(lián)邦大模型」,憑什么在會議場景媲美 GPT-4?
「三個臭皮匠,頂個諸葛亮」。作者丨何思思編輯丨陳彩嫻今年 8 月,在雷峰網(wǎng)于新加坡舉辦的 GAIR 大會主論壇上,前微軟全球技術(shù)院士、美國雙院院士黃學(xué)東用一...
上云還是下云:章文嵩博士解讀真正的云原生 Kafka 十倍降本方案!
作者|章文嵩、周新宇 策劃 | Tina近日,AutoMQ 團(tuán)隊(duì)發(fā)布了基于云的開源云原生 Kafka——AutoMQ for Kafka,所有的代碼采用 Apache 2.0 開源許可。AutoMQ 充分...
RAG+GPT-4 Turbo讓模型性能飆升!更長上下文不是終局,「大海撈針」實(shí)驗(yàn)成本僅4%
新智元報道編輯:桃子【新智元導(dǎo)讀】RAG或許就是大模型能力飆升下一個未來。RAG+GPT-4,4%的成本,便可擁有卓越的性能。這是最新的「大海撈針」實(shí)驗(yàn)得出的結(jié)...
能耗比達(dá)到GPT-4 10倍!黃學(xué)東親自解密Zoom AI的成功之道,AI伴侶直接替你開會
新智元報道編輯:潤 alan【新智元導(dǎo)讀】Zoom CTO黃學(xué)東發(fā)文,討論了Zoom對于高效處理AI任務(wù)需求采用的技術(shù)——Zoom聯(lián)邦A(yù)I。達(dá)到GPT-4性能的同時,Zoom AI只用了...
誰能代替英偉達(dá)?
英偉達(dá)的鎧甲和軟肋本文轉(zhuǎn)自《遠(yuǎn)川研究所》;作者|葉子凌/何律衡 編輯|陳彬今年夏天,英偉達(dá)創(chuàng)始人黃仁勛專門騰出時間,拜訪了一家名叫戰(zhàn)略與國際研究中心 (C...
公測邀請:GreptimeAI —— LLM 應(yīng)用的可觀測性解決方案
隨著生成式大語言模型(下文簡稱為:LLM)的成熟,LLM 應(yīng)用的生態(tài)呈現(xiàn)爆炸式的增長,相應(yīng)監(jiān)控工具的需求也隨之上升。由于 LLM 對算力要求過高,性能優(yōu)化復(fù)雜...
OpenAI 將在首屆開發(fā)者大會上讓模型更便宜、更強(qiáng)大
點(diǎn)擊上方藍(lán)字關(guān)注我們圖|匡萃彪文|匡萃彪“ OpenAI在首次開發(fā)者大會上宣布了產(chǎn)品升級,使其AI模型更便宜、功能更強(qiáng)大。這些升級旨在鼓勵公司使用OpenAI的技...
OpenAI新模型研發(fā)遇挫,稀疏性是大模型降本的鑰匙嗎?
選自theinformation機(jī)器之心編譯編輯:小舟OpenAI 也有失敗的模型。大模型的訓(xùn)練與運(yùn)行成本極其高昂,OpenAI 也嘗試過降低成本,只可惜失敗了。去年年底,當(dāng) ...
推理成本增加10倍?對文心大模型4.0的一些猜想
夕小瑤科技說 原創(chuàng)作者 | 賣萌醬大家好,我是賣萌醬。相信不少小伙伴這幾天都聽到了消息,在期待下周即將發(fā)布的文心大模型4.0。我們的幾個讀者群里也發(fā)生了相...
開發(fā)成本降至5%!OpenAI計(jì)劃推出新功能吸引開發(fā)者,也穩(wěn)住用他們模型虧損的“大冤種”客戶
作者|冬梅OpenAI 計(jì)劃推出新功能吸引開發(fā)者,稱開發(fā)成本最高降至 5%近日,路透社援引消息人士稱,為了吸引更多企業(yè)和開發(fā)者更多地使用其技術(shù),OpenAI 計(jì)劃...
打造ChatGPT平替,成本暴降95%!OpenAI硬核更新下月發(fā)布,視覺API要來
新智元報道編輯:桃子 好困【新智元導(dǎo)讀】為了吸引更多開發(fā)者,OpenAI正在計(jì)劃一波重大更新,并且讓構(gòu)建ChatGPT應(yīng)用的成本降低多達(dá)20倍!天下開發(fā)人員,苦Ope...
ChatGPT們紅遍全球卻不賺錢?每月虧損高達(dá)3000萬美元
夕小瑤科技說 分享來源 | 量子位 作者 | 豐色 蕭簫別看全球科技圈都在大模型上轟轟烈烈搞了這么久——做出來的熱門產(chǎn)品居然還是賠錢的?!就拿這里面最“得勢”的...