標簽:模型
全面的中文大語言模型評測來啦!香港中文大學研究團隊發布
允中 發自 凹非寺量子位 | 公眾號 QbitAIChatGPT 的一聲號角吹響了2023年全球大語言模型的競賽。2023年初以來,來自工業界和研究機構的各種大語言模型層出不...
大語言模型擊敗擴散模型!視頻圖像生成雙SOTA,谷歌CMU最新研究,一作北大校友
白交 發自 凹非寺量子位 | 公眾號 QbitAI語言模型擊敗擴散模型,在視頻和圖像生成上實現雙SOTA!這是來自谷歌CMU最新研究成果。據介紹,這是語言模型第一次在...
一周AI熱點(10月9日-10月15日)
圖|匡萃彪文|匡萃彪OpenAI 年入13億美元,下月將推出重大更新OpenAI計劃在下個月推出重大更新,旨在使其AI模型更容易為開發者所用,降低應用開發成本最多20...
最新AI熱點論文(10/9-10/15)
圖|匡萃彪文|匡萃彪最新人工智能論文(10/9-10/15):- 環形注意力- 通用模擬器- LLMs中事實性的概述- LLMs 能學規則- LLM的元思維鏈提示- 醫療保健LLM調查...
推理成本增加10倍?對文心大模型4.0的一些猜想
夕小瑤科技說 原創作者 | 賣萌醬大家好,我是賣萌醬。相信不少小伙伴這幾天都聽到了消息,在期待下周即將發布的文心大模型4.0。我們的幾個讀者群里也發生了相...
“大大震驚”一位CTO:GPT-4V自動駕駛五連測關注前沿科技 量子位 2023-10-15 14:39 發表于北京
來源:量子位編者按:GPT-4V的到來,給AI又帶來了無限可能。近日,圖森中國CTO王乃巖在知乎發表的《GPT-4V在自動駕駛中初探》引發了不少關注。在多項測試之后...
“大大震驚”一位CTO:GPT-4V自動駕駛五連測
編者按:GPT-4V的到來,給AI又帶來了無限可能。近日,圖森中國CTO王乃巖在知乎發表的《GPT-4V在自動駕駛中初探》引發了不少關注。在多項測試之后,他本人表示...
CCF CED 2023完整日程公布!10月21日,一起探討大模型時代的工程師文化
CCF CED 2023中國計算機學會工程師文化日將于10月21日在蘇州CCF業務總部 學術交流中心舉行,期待您的參與!在大模型技術引發的新的技術浪潮之中,即將于10月2...
字節跳動李航:對語言大模型的若干觀察和思考
機器之心專欄作者:ByteDance Research負責人李航本文闡述筆者對 LLM 的一些看法,主要觀點如下:ChatGPT 的突破主要在于規模帶來的質變和模型調教方式的發明...
值得一試的開源模型!開源社區上季度都有哪些靠譜項目?
在過去的一個季度,社區開源了不少「值得一試」的通用模型,包括 LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B 等...
「Meta版ChatGPT」背后的技術:想讓基礎LLM更好地處理長上下文,只需持續預訓練
機器之心報道編輯:Panda W在處理長上下文方面,LLaMA 一直力有不足,而通過持續預訓練和其它一些方法改進,Meta 的這項研究成功讓 LLM 具備了有效理解上下文...
SGD 的光輝,帶來深度學習的意義
大數據文摘出品7月份,紐約大學(NYU)博士后Naomi Saphra撰寫了一篇題為“Interpretability Creationism”,從進化論的角度解釋了隨機梯度下降(SGD)與深度學...
LangChain 不好用的原因是,它起步于一場程序員的自嗨
當庫克站在蘋果總部大樓外圍草坪的虛擬背景前開始展示全新的 15 pro 系列 iPhone,居住在波蘭的產品設計師 Volodymyr 轉頭拿起手機。他發了一條推特:「我懷...
OpenAI靠ChatGPT賺翻了!年收入較去年翻45倍
來源:硅星人Pro據外媒報道,ChatGPT 制造商 OpenAI 首席執行官Sam Altman本周告訴員工,OpenAI 的年化標準收入達到了 13 億美元。Altman的這次發言意味著,O...
別再「浪費」GPU了,FlashAttention重磅升級,實現長文本推理速度8倍提升
機器之心報道機器之心編輯部處理小說、法律文件等長文本是大模型的一個重要應用方向,但也面臨速度上的挑戰。FlashAttention 作者 Tri Dao 等人提出的「Flash...
粵公網安備 44011502001135號