標(biāo)簽:語言
Google DeepMind 最新研究:搞定這三個(gè)任務(wù)?人類不行,AI 也不行
撰文 | 趙雅琦前言人工智能(AI)并非完美的推理者,即使是當(dāng)前大熱的語言模型(LMs),也同樣會(huì)表現(xiàn)出與人類類似的錯(cuò)誤傾向,尤其是出現(xiàn)顯著的“內(nèi)容效應(yīng)”(C...
Ilya Sutskever 離職后首次采訪:個(gè)人經(jīng)歷,Scaling Laws,AI幻覺
來源:AI寒武紀(jì) Ilya Sutskever自從 OpenAI 趕走 Sam Altman 后首次接受播客采訪,他提到了 AI 和深度學(xué)習(xí)的過去、現(xiàn)在和未來。他回顧了他從 17 歲起與 Jeff ...
「后訓(xùn)練 + STaR」是 OpenAI 絕密項(xiàng)目「草莓」背后的秘密嗎?
機(jī)器之心PRO · 會(huì)員通訊 Week 29---- 本周為您解讀 ③個(gè)值得細(xì)品的AI & Robotics業(yè)內(nèi)要事 ---- 1. 「后訓(xùn)練 + STaR」是 OpenAI 絕密項(xiàng)目「草莓」背后的秘...
KDD 2024|港大黃超團(tuán)隊(duì)深度解析大模型在圖機(jī)器學(xué)習(xí)領(lǐng)域的「未知邊界」
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
【阿姆斯特丹博士論文】以實(shí)體為中心的神經(jīng)模型用于自然語言處理
來源:專知 這篇論文探討了如何通過將實(shí)體信息納入神經(jīng)網(wǎng)絡(luò)模型來增強(qiáng)自然語言理解。它解決了三個(gè)關(guān)鍵問題: 利用實(shí)體進(jìn)行理解任務(wù):本文引入了Entity-GCN模...
創(chuàng)業(yè)者復(fù)盤:出?!氨镜鼗边^程中,我犯了哪些錯(cuò)?
本文作者楊杰是一位產(chǎn)品經(jīng)理出身的創(chuàng)業(yè)者,所在團(tuán)隊(duì)從2019 年開始做國(guó)內(nèi) SAAS 業(yè)務(wù),2022年觀察到國(guó)內(nèi)業(yè)務(wù)出現(xiàn)瓶頸,開始尋求第二增長(zhǎng)曲線。 2022年4月,產(chǎn)品...
清華大合斯坦福大學(xué)提出混合注意力機(jī)制MoA,大模型解碼速率提高6倍
夕小瑤科技說 原創(chuàng)作者 | Richard 隨著大語言模型的規(guī)模不斷擴(kuò)大,如何在保持模型性能的同時(shí)提高其效率,成為了當(dāng)前研究的熱點(diǎn)問題。最近,清華大學(xué)聯(lián)合斯坦...
對(duì)話南洋理工大學(xué)安波教授:如何讓大語言模型適應(yīng)動(dòng)態(tài)環(huán)境?
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自AI科技評(píng)論 作者丨陳鷺伊 編輯丨岑峰 對(duì)人類越是簡(jiǎn)單的問題,大語言模型反而越難以做好? 盡管現(xiàn)在的大模型已經(jīng)有能力沖擊數(shù)學(xué)競(jìng)賽級(jí)別...
對(duì)話南洋理工大學(xué)安波教授:如何讓大語言模型適應(yīng)動(dòng)態(tài)環(huán)境?丨IJAIRR
智能體實(shí)現(xiàn)AGI的自我超越,從與環(huán)境交互做起。作者丨陳鷺伊 編輯丨岑峰 對(duì)人類越是簡(jiǎn)單的問題,大語言模型反而越難以做好? 盡管現(xiàn)在的大模型已經(jīng)有能力沖擊...
上海AI lab開源LLaMAX,用3.5萬小時(shí)的A100訓(xùn)練讓大模型掌握上百種語言翻譯
夕小瑤科技說 原創(chuàng)作者 | Richard 在這個(gè)AI大爆發(fā)的時(shí)代,各種智能工具如雨后春筍般涌現(xiàn),大語言模型的能力也在不斷刷新我們的認(rèn)知。隨便拉出一個(gè)AI模型,似...
無損加速最高5x,EAGLE-2讓RTX 3060的生成速度超過A100
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
拋棄視覺編碼器,這個(gè)「原生版」多模態(tài)大模型也能媲美主流方法
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
初創(chuàng)公司硬剛英偉達(dá):在AMD卡上模擬CUDA,原版程序直接編譯運(yùn)行
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI無需任何修改轉(zhuǎn)換,AMD顯卡也跑起原版CUDA程序了! 英國(guó)一家初創(chuàng)公司,推出了針對(duì)AMD的CUDA程序編譯工具,而且免費(fèi)...
大語言模型的前世今生:萬字長(zhǎng)文完整梳理所有里程碑式大語言模型(LLMs)
點(diǎn)擊下方卡片,關(guān)注“AI生成未來” >>后臺(tái)回復(fù)“GAI”,免費(fèi)獲取AI行業(yè)報(bào)告和資料! 作者:APlayBoy編輯:AI生成未來 鏈接:https://zhuanlan.zhihu.com/p/...
阿里開源語音處理模型 FunAudioLLM :50 種語言無縫翻譯,還能識(shí)別語音情緒
作者 | 趙明華 阿里巴巴通義實(shí)驗(yàn)室近日發(fā)布并開源了 FunAudioLLM,這是一個(gè)旨在增強(qiáng)人與大型語言模型(LLMs)之間自然語音交互的框架,代表了語音處理領(lǐng)域的...