標簽:模型

玩10次ChatGPT就要消耗1升水|加州大學河濱分校研究結果

西風 發自 凹非寺量子位 | 公眾號 QbitAI用5次ChatGPT,最高可消耗500毫升水。這是研究人員對OpenAI訓模型耗水量調查后給出的結果。此外,據微軟最新環境報告...
閱讀原文

扒一扒騰訊混元大模型“老底”

魚羊 蕭簫 發自 凹非寺量子位 | 公眾號 QbitAI騰訊自研混元通用大模型,終于正式在騰訊全球數字生態大會上亮相。模型亮相的同時,騰訊還宣布幾大騰訊業務就已...
閱讀原文

十問復旦邱錫鵬:大模型進入安卓時代,希望有國產模型能代替LIama

楊凈 發自 凹非寺量子位 | 公眾號 QbitAI大模型進入安卓時代,希望有國產模型能代替LIama。千模大戰序幕拉起,復旦邱錫鵬教授這樣說。作為國內最早推出類Chat...
閱讀原文

清華智能體宇宙火了,AI模擬“囚徒困境”等實驗只需幾行簡單配置

豐色 發自 凹非寺量子位 | 公眾號 QbitAI可以輕松模擬社會實驗的多智能體宇宙來了——它由清華大學聯合北郵、微信團隊推出,目前已在GitHub攬獲1.1k標星。名字...
閱讀原文

AIGC最新動態丨9月12日行業大匯總!

AIGC行業資訊國外熱點速覽俄羅斯科技巨頭 Yandex 開發 GPT 大模型;消息稱 Meta 計劃明年初開發全新的大型語言模型;戴爾和利默里克大學合作,搭建 AI 平臺用...
閱讀原文

大模型應用創業大賽開啟,與頂級投資人和技術大咖共同打造你的創意產品!

夕小瑤科技說 分享來源 | 百度飛槳親愛的科技探險家們和代碼魔法師們:未來的鐘聲已經敲響,預示著一場極度炫酷的虛擬現實游戲即將展開。從初期簡單的智能識...
閱讀原文

大模型偏見有多嚴重?柏林洪堡大學發布新工具OpinionGPT,你的AI真的公正嗎?

夕小瑤科技說 原創作者 | 謝年年近年來,指令調優的大型語言模型(LLM)在各個問答任務上表現出色。然而,受訓練數據的影響,這些模型的回答可能存在隱含的偏...
閱讀原文

碾壓H100!英偉達GH200超級芯片首秀MLPerf v3.1,性能躍升17%

新智元報道編輯:編輯部【新智元導讀】傳說中的英偉達GH200在MLPerf 3.1中驚艷亮相,性能直接碾壓H100,領先了17%。繼4月份加入LLM訓練測試后,MLPerf再次迎...
閱讀原文

推理飆升2倍!普林斯頓北大校友祭出多頭「美杜莎」,33B模型與13B一樣快

新智元報道編輯:桃子 好困【新智元導讀】大模型推理加速如何破局?普林斯頓、UIUC等機構華人團隊提出一個簡單框架Medusa,訓練多個解碼頭,直接讓LLM推理速...
閱讀原文

超越ToT,蘇黎世理工發布新一代思維圖GoT:推理質量提升62%,成本降低31%

新智元報道編輯:LRS【新智元導讀】推理速度、推理質量二者兼得,全新一代思維圖GoT可以處理更復雜推理任務!大型語言模型在推理上仍然是弱勢項目,需要依賴...
閱讀原文

李云龍、謝耳朵專業陪聊!角色扮演系統ChatHaruhi爆火:支持32個中外角色,開源5.4萬條對話數據

新智元報道編輯:LRS【新智元導讀】GitHub斬獲700+stars,除了二次元角色,ChatHaruhi還支持《武林外傳》、《亮劍》、《生活大爆炸》、于謙等經典角色!「角...
閱讀原文

CIKM 2023|TASTE:通過文本匹配緩解序列化推薦中流行偏差問題

作者丨劉正皓1、梅森1、熊辰炎2、李曉華1、于是 3、劉知遠3、谷峪1、于戈1機構丨1. 東北大學;2. 卡內基梅隆大學;3. 清華大學該論文發表于CIKM-2023論文鏈接...
閱讀原文

湯道生的下一場戰事:大模型時代的產業「智能化」升級戰怎么打?

機器之心原創作者:張倩湯道生談大模型時代產業「智能化」打法:直奔主題、跑「馬拉松」、保持開放。2023 年上半年,百模大戰如火如荼,成了國內 AI 領域最熱...
閱讀原文

32卡176%訓練加速,開源大模型訓練框架Megatron-LLaMA來了

機器之心發布機器之心編輯部9 月 12 日,淘天集團聯合愛橙科技正式對外開源大模型訓練框架 ——Megatron-LLaMA,旨在讓技術開發者們能夠更方便的提升大語言模型...
閱讀原文

GPT太「奢侈」,平替大匯總來了,再也不用擔心部署大難題

機器之心報道機器之心編輯部超多平替,按需選取。近年來,生成式預訓練模型(如 GPT)的興起徹底顛覆了自然語言處理領域,其影響甚至已經延伸到其他多種模態...
閱讀原文