標簽:任務

GPT-4搞不定的圖推理,港科大7B模型搞定|KDD2024

香港科技大學 陳諾 投稿量子位 | 公眾號 QbitAI大模型執行圖推理任務,我們是希望大模型僅僅給出結果,還是在給出準確答案的同時,輸出詳細的推理過程? 先來...
閱讀原文

拿下SOTA!最強中文Embedding模型對標OpenAI,技術路線公開

新智元報道編輯:編輯部 【新智元導讀】國產大模型「日日新 5.0」已經在權威主流評測中鯊瘋了。變強的背后原因竟是,來自商湯自研中文Embedding模型——Piccolo...
閱讀原文

大模型在持續學習中的最新進展:綜述

來源:專知 近年來,基礎語言模型(LMs)在自然語言處理(NLP)和計算機視覺(CV)領域取得了顯著成就。與傳統神經網絡模型不同,基礎語言模型通過在大量無監...
閱讀原文

偏微分方程有了基礎模型:樣本需求數量級減少,14項任務表現最佳

機器之心報道 編輯:陳萍本文提出的 Poseidon 在樣本效率和準確率方面都表現出色。偏微分方程(PDEs)被稱為物理學的語言,因為它們可以在廣泛的時間 - 空間...
閱讀原文

GPT-4人類高達99.16%驚人率!PNAS重磅研究曝出,LLM推理越強值越高

新智元報道編輯:桃子 喬楊 【新智元導讀】最近,德國研究科學家發表的PANS論文揭示了一個令人擔憂的現象:LLM已經涌現出「欺騙能力」,它們可以理解并誘導欺...
閱讀原文

Llama3-8B秒殺700億巨獸?北大博士生等全新「BoT」框架推理暴漲70倍,24點圖形推理一步成神

新智元報道編輯:Aeneas 好困 【新智元導讀】24點游戲、幾何圖形、一步將死問題,這些推理密集型任務,難倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研...
閱讀原文

清華系細胞大模型登Nature子刊!能對人類2萬基因同時建模,代碼已開源

白交 發自 凹非寺量子位 | 公眾號 QbitAI生命科學領域的基礎大模型來了! 來自清華、百圖生科的團隊提出的單細胞基礎大模型scFoundation,登上Nature Methods...
閱讀原文

今日arXiv最熱大模型論文:大模型都能怎么用?中南大學最新綜述:大模型時代的自然語言處理

夕小瑤科技說 原創作者 | Axe_越還記得2022年末ChatGPT的橫空出世,帶來了整個NLP乃至AI領域的震動,隨后如LLaMA、ChatGLM、Qwen等類ChatGPT大模型(LLM)開...
閱讀原文

3B模型新SOTA!開源AI讓日常調用不同大模型更簡單

NEXA AI 投稿量子位 | 公眾號 QbitAI大模型,大,能力強,好用! 但單一大模型在算力、數據和能耗方面面臨巨大的限制,且消耗大量資源。 而且目前最強大的模...
閱讀原文

多模態模型學會打撲克:表現超越GPT-4v,全新強化學習框架是關鍵

Simon Zhai 投稿量子位 | 公眾號 QbitAI只用強化學習來微調,無需人類反饋,就能讓多模態大模型學會做決策! 這種方法得到的模型,已經學會了看圖玩撲克、算“...
閱讀原文

LeCun新作:分層世界模型,數據驅動的人型機器人控制

新智元報道編輯:alan 【新智元導讀】在復雜的物理世界中,人型機器人的全身控制一直是個難題,現有的強化學習做出的效果有時會比較抽象。近日,LeCun參與的...
閱讀原文

SpaceX 與日本億萬富豪「分手」,dearMoon 環月之旅宣布暫停

dearMoon 環月之旅 取消日本億萬富豪前澤友作曾高調宣布自己將乘坐 SpaceX 的星艦,進行一場「環月之旅」。如果順利飛行,這將是 1972 年美國阿波羅登月計劃...
閱讀原文

淺談大模型 SFT 的實踐落地:10 問 10 答

來源|知乎—周星星 地址|https://zhuanlan.zhihu.com/p/685582706 前言SFT 是“低端”的工作,但它與業務緊密相連。相較于難以實施且多數公司沒資源訓練的預訓...
閱讀原文

英偉達新研究:上下文長度虛標嚴重,32K性能合格的都不多

西風 發自 凹非寺量子位 | 公眾號 QbitAI無情戳穿“長上下文”大模型的虛標現象—— 英偉達新研究發現,包括GPT-4在內的10個大模型,生成達到128k甚至1M上下文長...
閱讀原文

next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+

新智元報道編輯:LRS 【新智元導讀】研究人員提出了一種新的大型語言模型訓練方法,通過一次性預測多個未來tokens來提高樣本效率和模型性能,在代碼和自然語...
閱讀原文
1161718192048