標簽:能力

思維鏈提出者Jason Wei:關于大模型的6個直覺

選自 jasonwei.net/blog作者:Jason Wei機器之心編譯編輯:Panda大模型究竟從下一個詞預測任務中學到了什么呢?還記得 Jason Wei 嗎?這位思維鏈的提出者還曾...
閱讀原文

大模型免微調解鎖對話能力,RLHF沒必要了!一作上交大校友:節省大量成本和時間

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI要搞大模型AI助手,像ChatGPT一樣對齊微調已經是行業標準做法,通常分為SFT+RLHF兩步走。來自艾倫研究所的新研究卻發...
閱讀原文

秒殺700億Llama 2!最新國產大模型亮相,無需申請即可免費商用,背后公司來自私募巨頭

豐色 發自 凹非寺量子位 | 公眾號QbitAI國產大模型剛剛出了一位全新選手:參數670億的DeepSeek。它在近20個中英文的公開評測榜單上直接超越了同量級、700億的...
閱讀原文

云知聲董事長梁家恩:AGI 賦能未來的力量|甲子引力

當問題可以被計算時,超越人類智能或許只是時間問題。11月30日-12月1日,由中國科技產業智庫「甲子光年」主辦的「致追風趕月的你」2023甲子引力年終盛典在北...
閱讀原文

大模型版“5年高考3年模擬”來了!6141道數學題,還是多模態的那種|微軟&UCLA&UW聯合出品

Pan Lu投稿量子位 | 公眾號 QbitAI大模型的“5年高考3年模擬”數學題來了,還是加強強強版!微軟、加州大學洛杉磯分校(UCLA)、華盛頓大學(UW)聯合打造全新...
閱讀原文

112頁報告深挖GPT-4V!UCLA等發布全新「多模態數學推理」基準MathVista

新智元報道編輯:LRS 好困【新智元導讀】大型多模態模型會做數學題嗎?在UCLA等機構最新發布的MathVista基準上,即使是當前最強的GPT-4V也會感到「挫敗感」。...
閱讀原文

【重磅】解碼OpenAI Q*:邁向AGI的信仰之躍

作者|費斌杰隨著OpenAI CEO的罷免鬧劇逐漸平息,隱藏在整個事件背后的“Q*”模型浮出水面。據路透社消息,在Sam Altman罷免前夕,幾位OpenAI的科學家向董事會寫...
閱讀原文

微軟教小模型推理進階版:Orca 2性能媲美10倍參數模型,已開源

機器之心報道機器之心編輯部站在巨人的肩膀上會讓你看的更遠,而通過讓大規模語言模型來「教」較小規模的語言模型進行推理,也會是事半功倍的效果。如你我所...
閱讀原文

國產720億參數開源免費模型來了!對標Llama2 70B,一手實測在此

魚羊 發自 凹非寺量子位 | 公眾號 QbitAI最強開源大模型,再次易主!就在剛剛,阿里云通義千問又雙叒開源了,并且直接開大:甩出了720億參數版本——在中國的開...
閱讀原文

720億參數大模型都拿來開源了!通義千問開源全家桶,最小18億模型端側都能跑

機器之心原創作者:張倩、杜偉目前,通義千問開源全家桶已經有了 18 億、70 億、140 億、720 億參數量的 4 款基礎開源模型,以及跨語言、圖像、語音等多種模...
閱讀原文

打通大模型訓練任督二脈!國內首個千億參數、全面開源大模型來了,還聯手開發者共訓

浪潮信息算法、數據、計算三大創新黑科技,大幅提升大模型智力水平。作者|程茜編輯|漠影智東西11月30日報道,11月27日,算力龍頭企業浪潮信息發布了完全開源...
閱讀原文

大模型深入智慧之地,手機廠商會如何交卷?

受訪嘉賓 | 劉海鋒OPPO 數智工程事業部總裁作者 | 羅燕珊1一條新路出現:跟風與乘勢?大模型浪潮下的未見與先見在蓬勃發展的 AI 浪潮中,各行各業似乎都在積...
閱讀原文

對話360集團梁志輝:360是如何做大模型的?|甲子光年

1個千億的大模型+N個百億小模型的部署方式或許是最優路線。作者|蘇霍伊???編輯|趙健???明天,是 ChatGPT 問世一周年的日子。過去的一年時間已證明,AI 大模...
閱讀原文

大模型+自動駕駛=?普渡大學等最新《自動駕駛領域多模態大型語言模型》綜述

來源:專知隨著大型語言模型(LLMs)和視覺基礎模型(VFMs)的出現,利用大型模型的多模態AI系統有潛力像人類一樣感知現實世界、做出決策和控制工具。近幾個...
閱讀原文

大模型時代,“人人可AI”的百度開發者平臺長什么樣?

轉載自 51CTO技術棧,作者:云昭,嘉賓:張瑞星大模型時代的開發者平臺,不僅要提供 AI 原生能力,還要具備生態打造和商業化閉環能力。提及“靈境”,人們在腦...
閱讀原文
1424344454656