標簽:答案
8B模型奧數成績比肩GPT-4!上海AI Lab出品
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只要1/200的參數,就能讓大模型擁有和GPT-4一樣的數學能力? 來自復旦和上海AI實驗室的研究團隊,剛剛研發出了具有...
大模型+蒙特卡洛樹搜索,一招讓LLaMa-3 8B奧數水平直逼GPT-4
機器之心報道 編輯:陳萍、杜偉通過算法層面的創新,未來大語言模型做數學題的水平會不斷地提高。這幾天,17 歲中專生姜萍在 2024 阿里巴巴全球數學競賽預選...
AI 問前程:這樣的分數高考志愿應該報哪所大學
選擇困難癥:盡力就行了,難道不選清華是因為自己不想?高考志愿填報,是每個學生人生中的第一次重大選擇,也是一場令人倍感焦慮的“選擇困難癥”考驗。面對眾...
兩句話,讓LLM邏輯推理瞬間崩潰!最新「愛麗絲夢游仙境」曝出GPT、Claude等重大缺陷
新智元報道編輯:喬楊 好困 【新智元導讀】在基準測試上頻頻屠榜的大模型們,竟然被一道簡單的邏輯推理題打得全軍覆沒?最近,研究機構LAION的幾位作者共同發...
長文 | 大模型偏好對齊全家桶 – RL側
今天給大家帶來一篇Reinforcement Learning from Human Feedback的全家桶,來自知乎@何枝(已授權)。 隨著 Llama3 的開源,人們對 Alignment 的重視程度又上...
清北爸爸輔導數學崩潰瞬間,這個國產大模型有解!AI啟發問答關鍵情緒穩定
新智元報道編輯:編輯部 【新智元導讀】輔導孩子寫作業這件事,竟難倒了一眾清北爸爸、海淀媽媽。不過,最近爆火的這個國產大模型,讓無數家長瘋狂沖進視頻留...
今日arXiv最熱大模型論文:COLING 2024: 復旦發布AoR,層級聚合推理突破大模型復雜推理上限
夕小瑤科技說 原創作者 | Axe_越“三個臭皮匠,頂個諸葛亮?” “一個模型不行,那就再堆一個?” 過去當我們在處理復雜任務的時候,往往會考慮集成策略(Ensembl...
70億LLaMA媲美5400億PaLM!MIT驚人研究用「博弈論」改進大模型|ICLR 2024
新智元報道編輯:桃子 【新智元導讀】大模型回答如何更可靠?MIT研究團隊設計出「共識博弈」,將數學家常用的博弈論引入LLM改進中。沒想到,LLaMA-7B的表現,...
微信一個逆天功能已悄悄上線!99%的人還不知道…
點擊上方藍字關注我們“微信讀書新推出的“AI問書”功能,允許用戶在閱讀時直接查詢疑惑內容,答案來自微信讀書內書籍,可即時跳轉閱讀。該功能極大提升了閱讀效...
「專業智能體指導」讓小模型學會數學推理!微調Mistral-7B實現86.81%準確率
新智元報道編輯:LRS 【新智元導讀】小模型也能解鎖數學能力,無需多模型集成,7B模型在GSM 8 k數據集上性能超越70B!對于小型語言模型(SLM)來說,數學應用...
西安交大發表魯棒視覺問答綜述,揭秘AI視覺問答的“超強大腦”丨IEEE TPAMI
2024年2月,西安交通大學智能網絡與網絡安全教育部重點實驗室與陜西省大數據知識工程實驗室(跨媒體知識融合與工程應用研究所)師生,在人工智能頂級期刊IEEE...
黃仁勛每天都用的 AI 產品,來自 Google,顛覆 Google
要成功 不意味著 要替代 Google因為 Google CEO Sundar Pichai 吃雞蛋,Perplexity CEO Aravind Srinivas 才能吃雞蛋。 來自于印度的 Srinivas 從小家庭就吃...
體驗完黃仁勛最愛用的 AI 工具:Google 不香了,還能平替 ChatGPT
黃仁勛 都愛用的 AI 工具英偉達創始人黃仁勛最愛用的 AI 聊天機器人是什么?《連線》雜志的采訪揭開了謎底——Perplexity。 比起 ChatGPT, Perplexity 的熱度...
今日arXiv最熱大模型論文:人民大學發布,拯救打工人!Office真實場景下的大模型表格處理
夕小瑤科技說 原創作者 | 松果 引言:探索表格數據處理的新視角在當今的數據驅動世界中,表格數據無處不在,它們以其獨特的結構化形式,為各行各業提供了信息...
老黃再曝驚人語錄:LLM幻覺有解,AGI五年內必來!
新智元報道編輯:編輯部 【新智元導讀】AGI競賽,正在大科技公司之間緊鑼密鼓地展開,作為萬億顯卡帝國掌舵人的老黃自然也不會缺席。在最近舉辦的GTC 2024上...