標簽：模型

全面的中文大語言模型評測來啦！香港中文大學研究團隊發布

允中發自凹非寺量子位 | 公眾號 QbitAIChatGPT 的一聲號角吹響了2023年全球大語言模型的競賽。2023年初以來，來自工業界和研究機構的各種大語言模型層出不...

閱讀原文

AIGC動態

2年前 (2023)

大語言模型擊敗擴散模型！視頻圖像生成雙SOTA，谷歌CMU最新研究，一作北大校友

白交發自凹非寺量子位 | 公眾號 QbitAI語言模型擊敗擴散模型，在視頻和圖像生成上實現雙SOTA！這是來自谷歌CMU最新研究成果。據介紹，這是語言模型第一次在...

閱讀原文

AIGC動態

2年前 (2023)

一周AI熱點（10月9日-10月15日）

圖｜匡萃彪文｜匡萃彪OpenAI 年入13億美元，下月將推出重大更新OpenAI計劃在下個月推出重大更新，旨在使其AI模型更容易為開發者所用，降低應用開發成本最多20...

閱讀原文

AIGC動態

2年前 (2023)

推理成本增加10倍？對文心大模型4.0的一些猜想

夕小瑤科技說原創作者 | 賣萌醬大家好，我是賣萌醬。相信不少小伙伴這幾天都聽到了消息，在期待下周即將發布的文心大模型4.0。我們的幾個讀者群里也發生了相...

閱讀原文

AIGC動態

2年前 (2023)

“大大震驚”一位CTO：GPT-4V自動駕駛五連測關注前沿科技量子位 2023-10-15 14:39 發表于北京

來源：量子位編者按：GPT-4V的到來，給AI又帶來了無限可能。近日，圖森中國CTO王乃巖在知乎發表的《GPT-4V在自動駕駛中初探》引發了不少關注。在多項測試之后...

閱讀原文

AIGC動態

2年前 (2023)

“大大震驚”一位CTO：GPT-4V自動駕駛五連測

編者按：GPT-4V的到來，給AI又帶來了無限可能。近日，圖森中國CTO王乃巖在知乎發表的《GPT-4V在自動駕駛中初探》引發了不少關注。在多項測試之后，他本人表示...

閱讀原文

AIGC動態

2年前 (2023)

CCF CED 2023完整日程公布！10月21日，一起探討大模型時代的工程師文化

CCF CED 2023中國計算機學會工程師文化日將于10月21日在蘇州CCF業務總部學術交流中心舉行，期待您的參與！在大模型技術引發的新的技術浪潮之中，即將于10月2...

閱讀原文

AIGC動態

2年前 (2023)

字節跳動李航：對語言大模型的若干觀察和思考

機器之心專欄作者：ByteDance Research負責人李航本文闡述筆者對 LLM 的一些看法，主要觀點如下：ChatGPT 的突破主要在于規模帶來的質變和模型調教方式的發明...

閱讀原文

AIGC動態

2年前 (2023)

值得一試的開源模型！開源社區上季度都有哪些靠譜項目？

在過去的一個季度，社區開源了不少「值得一試」的通用模型，包括 LLaMA 2、Baichuan 2、ChatGLM2-6B、Qwen-14B、InternLM-20B、Tigerbot-13B、Xverse-13B 等...

閱讀原文

AIGC動態

2年前 (2023)

「Meta版ChatGPT」背后的技術：想讓基礎LLM更好地處理長上下文，只需持續預訓練

機器之心報道編輯：Panda W在處理長上下文方面，LLaMA 一直力有不足，而通過持續預訓練和其它一些方法改進，Meta 的這項研究成功讓 LLM 具備了有效理解上下文...

閱讀原文

AIGC動態

2年前 (2023)

SGD 的光輝，帶來深度學習的意義

大數據文摘出品7月份，紐約大學（NYU）博士后Naomi Saphra撰寫了一篇題為“Interpretability Creationism”，從進化論的角度解釋了隨機梯度下降（SGD）與深度學...

閱讀原文

AIGC動態

2年前 (2023)

LangChain 不好用的原因是，它起步于一場程序員的自嗨

當庫克站在蘋果總部大樓外圍草坪的虛擬背景前開始展示全新的 15 pro 系列 iPhone，居住在波蘭的產品設計師 Volodymyr 轉頭拿起手機。他發了一條推特：「我懷...

閱讀原文

AIGC動態

2年前 (2023)

OpenAI靠ChatGPT賺翻了！年收入較去年翻45倍

來源：硅星人Pro據外媒報道，ChatGPT 制造商 OpenAI 首席執行官Sam Altman本周告訴員工，OpenAI 的年化標準收入達到了 13 億美元。Altman的這次發言意味著，O...

閱讀原文

AIGC動態

2年前 (2023)

別再「浪費」GPU了，FlashAttention重磅升級，實現長文本推理速度8倍提升

機器之心報道機器之心編輯部處理小說、法律文件等長文本是大模型的一個重要應用方向，但也面臨速度上的挑戰。FlashAttention 作者 Tri Dao 等人提出的「Flash...

閱讀原文

AIGC動態

2年前 (2023)

1…439 440441442 443…483

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

標簽：模型

全面的中文大語言模型評測來啦！香港中文大學研究團隊發布

大語言模型擊敗擴散模型！視頻圖像生成雙SOTA，谷歌CMU最新研究，一作北大校友

一周AI熱點（10月9日-10月15日）

最新AI熱點論文（10/9-10/15）

推理成本增加10倍？對文心大模型4.0的一些猜想

“大大震驚”一位CTO：GPT-4V自動駕駛五連測關注前沿科技量子位 2023-10-15 14:39 發表于北京

“大大震驚”一位CTO：GPT-4V自動駕駛五連測

CCF CED 2023完整日程公布！10月21日，一起探討大模型時代的工程師文化

字節跳動李航：對語言大模型的若干觀察和思考

值得一試的開源模型！開源社區上季度都有哪些靠譜項目？

「Meta版ChatGPT」背后的技術：想讓基礎LLM更好地處理長上下文，只需持續預訓練

SGD 的光輝，帶來深度學習的意義

LangChain 不好用的原因是，它起步于一場程序員的自嗨

OpenAI靠ChatGPT賺翻了！年收入較去年翻45倍

別再「浪費」GPU了，FlashAttention重磅升級，實現長文本推理速度8倍提升