標(biāo)簽:研究者

首批類Sora模型出現(xiàn),色拉布上線Snap Video,效果優(yōu)于Pika、不輸Gen-2

機(jī)器之心報(bào)道 編輯:杜偉、蛋醬文生視頻這個(gè)戰(zhàn)場,入局的玩家越來越多了。這次是閱后即焚 SnapChat 背后的公司。 最近,OpenAI 視頻生成模型 Sora 的爆火,給...
閱讀原文

復(fù)旦發(fā)布!通過集成小推理引擎,賦能大模型邏輯推理能力

夕小瑤科技說 原創(chuàng)作者 | 芒果、python引言:探索大語言模型的邏輯推理能力在人工智能領(lǐng)域,大語言模型(LLMs)的推理能力一直是研究的熱點(diǎn)。這些模型在各種...
閱讀原文

端側(cè)最強(qiáng),Meta田淵棟等人卷10億以下參數(shù)小模型,LeCun:小技巧啟動(dòng)

機(jī)器之心報(bào)道 機(jī)器之心編輯部Meta 推出 MobileLLM 系列,一款適用于移動(dòng)設(shè)備上的「小」模型。「在移動(dòng)設(shè)備上運(yùn)行 LLM?可能需要 Meta 的一些技巧。」剛剛,圖...
閱讀原文

大模型Scaling Law同樣適用于下游任務(wù)性能?斯坦福、谷歌最新研究揭秘

機(jī)器之心報(bào)道 編輯:蛋醬、張倩大模型的成功很大程度上要?dú)w因于 Scaling Law 的存在,這一定律量化了模型性能與訓(xùn)練數(shù)據(jù)規(guī)模、模型架構(gòu)等設(shè)計(jì)要素之間的關(guān)系...
閱讀原文

目標(biāo)檢測新SOTA:YOLOv9問世,新架構(gòu)讓傳統(tǒng)卷積重?zé)ㄉ鷻C(jī)

機(jī)器之心報(bào)道 機(jī)器之心編輯部在目標(biāo)檢測領(lǐng)域,YOLOv9 實(shí)現(xiàn)了一代更比一代強(qiáng),利用新架構(gòu)和方法讓傳統(tǒng)卷積在參數(shù)利用率方面勝過了深度卷積。 繼 2023 年 1 月 ...
閱讀原文

全球最強(qiáng)開源大模型一夜易主!谷歌Gemma 7B碾壓Llama 2 13B,今夜重燃開源之戰(zhàn)

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】谷歌發(fā)布全球最強(qiáng)開源大模型Gemma,7B性能超越Llama 2 13B!谷歌和OpenAI,已經(jīng)卷出了新高度。這輪番放深夜炸彈的頻率...
閱讀原文

出圈的Sora帶火DiT,連登GitHub熱榜,已進(jìn)化出新版本SiT

機(jī)器之心報(bào)道 編輯:杜偉好的研究不會(huì)被埋沒,只會(huì)歷久彌新。雖然已經(jīng)發(fā)布近一周時(shí)間,OpenAI 視頻生成大模型 Sora 的影響仍在繼續(xù)! 其中,Sora 研發(fā)負(fù)責(zé)人...
閱讀原文

后Sora時(shí)代,CV從業(yè)者如何選擇模型?卷積還是ViT,監(jiān)督學(xué)習(xí)還是CLIP范式

機(jī)器之心報(bào)道 編輯:蛋醬如何衡量一個(gè)視覺模型?又如何選擇適合自己需求的視覺模型?MBZUAI和Meta的研究者給出了答案。一直以來,ImageNet 準(zhǔn)確率是評(píng)估模型...
閱讀原文

讓視覺語言模型搞空間推理,谷歌又整新活了

機(jī)器之心報(bào)道 機(jī)器之心編輯部視覺語言模型雖然強(qiáng)大,但缺乏空間推理能力,最近 Google 的新論文說它的 SpatialVLM 可以做,看看他們是怎么做的。視覺語言模型...
閱讀原文

OpenAI超級(jí)視頻模型Sora技術(shù)報(bào)告解讀,虛擬世界涌現(xiàn)了

夕小瑤科技說 分享來源 | 新智元 昨天白天,「現(xiàn)實(shí)不存在了」開始全網(wǎng)刷屏。 「我們這么快就步入下一個(gè)時(shí)代了?Sora簡直太炸裂了」。 「這就是電影制作的未來...
閱讀原文

一錘降維!解密OpenAI超級(jí)視頻模型Sora技術(shù)報(bào)告,虛擬世界涌現(xiàn)了

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】OpenAI首個(gè)AI視頻模型Sora橫空出世,再次創(chuàng)造歷史。這個(gè)堪稱「世界模型」的技術(shù)報(bào)告也在今天發(fā)布了,不過依然沒有公開...
閱讀原文

語音生成的「智能涌現(xiàn)」:10萬小時(shí)數(shù)據(jù)訓(xùn)練,亞馬遜祭出10億參數(shù)BASE TTS

機(jī)器之心報(bào)道 編輯:蛋醬伴隨著生成式深度學(xué)習(xí)模型的飛速發(fā)展,自然語言處理(NLP)和計(jì)算機(jī)視覺(CV)已經(jīng)經(jīng)歷了根本性的轉(zhuǎn)變,從有監(jiān)督訓(xùn)練的專門模型,轉(zhuǎn)...
閱讀原文

陪跑又快又穩(wěn),機(jī)器人跑步搭子來了

機(jī)器之心報(bào)道 編輯:陳萍、蛋醬這個(gè)機(jī)器人名叫Cassie,曾經(jīng)創(chuàng)下百米跑世界紀(jì)錄。最近,加州大學(xué)伯克利分校的研究者給它開發(fā)了一種新的深度強(qiáng)化學(xué)習(xí)算法,讓它...
閱讀原文

萬字長文,大語言模型如何宣告心理學(xué)的死亡?

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自追問nextquestion在心理學(xué)的歷史長河中,我們一直在追求對人類心理的深入理解。我們試圖解碼思維、情感和行為背后的復(fù)雜機(jī)制,希望借此...
閱讀原文

三年16篇一作,前谷歌研究科學(xué)家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5

機(jī)器之心報(bào)道 編輯:陳萍該團(tuán)隊(duì)的新模型在多個(gè)基準(zhǔn)測試中都與 Gemini Pro 、GPT-3.5 相媲美。 如果你經(jīng)常讀 AI 大模型方向的論文,Yi Tay 想必是一個(gè)熟悉的名...
閱讀原文
15678913