標簽:模型

國產語音對話大模型來了:李開復零一萬物參與,中英雙語多模態,開源可商用

蕭簫 發自 凹非寺量子位 | 公眾號 QbitAI首個中英雙語的語音對話開源大模型來了!這幾天,一篇關于語音-文本多模態大模型的論文出現在arXiv上,署名公司中出...
閱讀原文

張含望:大模型的研究離不開因果關系(Causality)丨GAIR 2023

這是一條必經之路。作者丨房曉楠編輯丨林覺民編者按:2023 年 8月14日,第七屆GAIR全球人工智能與機器人大會在新加坡烏節大酒店正式開幕。論壇由GAIR研究院、...
閱讀原文

顏水成加入昆侖萬維,任天工智能聯席CEO、2050全球研究院院長

機器之心報道編輯:澤南、小舟AI 大牛顏水成,要來造通用人工智能了。人工智能領域傳來重磅轉會消息。本周五晚間,昆侖萬維正式宣布計算機視覺、機器學習領域...
閱讀原文

用BigDL-LLM 即刻加速百億級參數LLM推理 | 最“in”大模型

作者:英特爾公司黃晟盛、黃凱、戴金權量子位 | 公眾號 QbitAI我們正邁入一個由大語言模型(Large Language Model, LLM)驅動的 AI 新時代,LLM在諸如客戶服...
閱讀原文

蘋果芯跑大模型不用降計算精度,投機采樣殺瘋了,GPT-4也在用

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI專攻代碼的Code Llama一出,大家伙都盼著誰來后續量化瘦身一下,好在本地也能運行。果然是llama.cpp作者Georgi Gerga...
閱讀原文

全方位實測文心一言

機器之心原創作者:杜偉、陳萍、澤南在大模型賦能的 AI 對話原生應用領域,文心一言 App 成為國內「首個」。8 月 31 日凌晨,AI 領域傳來重磅消息:百度、百...
閱讀原文

復旦大學團隊發布中文醫療健康個人助手,同時開源47萬高質量數據集

機器之心發布機器之心編輯部隨著遠程醫療的興起,在線問診、咨詢越發成為患者尋求便捷高效的醫療支持的首選項。近來大語言模型(LLM)展示出強大的自然語言交...
閱讀原文

微軟亞研提出TinyMIM,用知識蒸餾改進小型ViT

機器之心專欄微軟亞洲研究院本文提出了 TinyMIM,它是第一個成功地使小模型受益于MIM預訓練的模型。一、研究動機掩碼建模(MIM, MAE)被證明是非常有效的自監...
閱讀原文

GPT-4 MATH準確率最高漲至84.3%!港中文、清華等七所頂尖高校提出全新CSV方法

新智元報道編輯:LRS【新智元導讀】讓模型用代碼自我驗證解決方案,結合多數投票集成機制,推理準確率可以提升近30%!雖然大型語言模型(LLMs)在常識理解、...
閱讀原文

谷歌證實大模型能頓悟,特殊方法能讓模型快速泛化,或將打破大模型黑箱

新智元報道編輯:潤 好困【新智元導讀】谷歌團隊認為,模型泛化能力無處不在,只要摸清條件,模型就不是隨機鸚鵡。在特定情況下,人工智能模型會超越訓練數據...
閱讀原文

4個月狂攬兩千萬,國內首個披露營收的大模型來了!

新智元報道編輯:編輯部【新智元導讀】穩居國內第一梯隊的360智腦,已經開始賺錢了!根據360的2023年半年報,360智腦已創造近2000萬元相關業務收入,成為國內...
閱讀原文

算法聞到榴蓮臭!Science:AI嗅覺超人類,谷歌繪出50萬氣味圖譜

新智元報道編輯:編輯部【新智元導讀】谷歌團隊在Sience上發文稱,AI模型比人類具有更好的「嗅覺」。有了AI幫忙創造各種味道,吃貨們有福了。你想知道,下面...
閱讀原文

不用4個H100!340億參數Code Llama在Mac可跑,每秒20個token,代碼生成最拿手|Karpathy轉贊

新智元報道編輯:桃子【新智元導讀】現在,34B Code Llama模型已經能夠在M2 Ultra上的Mac運行了,而且推理速度超過每秒20個token,背后殺器竟是「投機采樣」...
閱讀原文

1句指令+5美元+20分鐘,就能訓練出小型專業模型,Prompt2Model了解一下

夕小瑤科技說 分享來源 | 機器之心CMU 與清華的研究者聯合發布了 Prompt2Model 框架,它可以根據用戶提供的 prompt,快速訓練一個小型專業模型。僅需投入 5 ...
閱讀原文

LeCun再潑冷水:只會看書的語言模型永遠無法實現「類人智能」

夕小瑤科技說 分享來源 | 新智元問題不在語言模型的學習算法,而是語言本身的固有局限性,多模態將引領下一次AI爆發!自去年ChatGPT發布后,業內外都涌現出了...
閱讀原文
1480481482483