国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

Kimi 數理化能跟 o1 掰手腕了?新模型 k1 有點兒強

AIGC動態9個月前發布 AI科技評論
397 0 0

2025 年,「推理」將是大模型競爭的下一個分水嶺。作者丨西西 張進編輯丨陳彩嫻今天,月之暗面官方宣布:繼 11 月 16 日發布數學模型 k0-math 后,他們又推出了新的視覺思考模型 k1,且「數理化」的能力又上了一個新臺階,實測結果絲毫不輸 OpenAI o1!最直接的實測例子是:當我們把楊振寧、伽利略等世界知名科學家的研究手稿拍照、上傳后,k1 居然能識別圖片中的文字,生動解讀背后的物理、天文學等科學知識,從而回答用戶的提問并給出清晰完整的推理思考過程。例如,當我們上傳楊振寧的手稿并向 k1 提問,k1 給出了超乎小編知識范疇所能辨真偽的答案:這是楊振寧的手稿圖片——這是我們的詢問:這是物理學家楊振寧的手稿照片,請你一步一步分析,楊振寧在計算什么,他可能在想什么,當時可能是什么背景?這是 k1 的回答:上下滑動查看長圖雖然小編既不懂電磁場、也不懂粒子動力學,但看完 k1 的答案著實大吃一驚!并忍不住發出靈魂叩問:圖靈測試面對大模型還有效嗎?人類讀者面對這樣的問題怎么區分 k1 與爾等用戶的區別?當 AI 大模型不斷進化,假以時日圖靈測試的標準答卷是否會變成:同一個問題的兩個不同答案,答案更高明的永遠盲選「機器」、答案更普通的永遠盲選「人類」……更重要的是:從數學模型 k0 到視覺思考模型 k1,月之暗面(Kimi)僅用了一個月!據了解,k1 是基于 k0 的模型升級。k0-math 模型數學能力出眾,但由于僅支持 LaTeX等格式的文本輸入,依賴圖形理解能力的部分幾何圖形題無法解決。而新的 k1 視覺思考模型借助端到端的圖像理解能力,解鎖了包括幾何題在內更加全面的數學能力。當多模態智能不斷進化,視覺模型的推理能力從文本拓展到「數理化」,我們可以大膽猜想:Kimi 大模型不僅能輕松解決傳統的文本與圖像信息對齊問題,連謝爾頓怎么教佩妮學物理的難題都能解決了!1中國首個視覺思考模型自 2021 年 1 月 OpenAI 發布 DALL·E 及圖文對齊架構 CLIP 以來,事實上業內針對圖像-文本任務的雙模態信息對齊與處理提出了多樣化的解決思路,并發表了大量工作。但過去三年來,這些模型的特征局限在文本數據上:首先,以生成為主,如文生圖任務,強調圖文對齊、而非推理。例如,國內有大批廠商早在今年上半年就已推出看圖說話功能,主要應用在旅游景點介紹、拍照生成搭配詩詞歌賦等,缺少較強的常識認知與邏輯推理等能力。其次,不具備一步一步拆解分析數理化問題的思維鏈能力,沒有將基礎大模型的語義理解與數理化問題的深度思考需求結合起來。此外,撇開底層基礎模型的能力差異不說,由于推理模型的產品體驗不如純文生圖或圖生視頻等來得直觀,模型的思考能力需要結合模型的文本輸出能力來獲得一手觀感。而其中,長文本是展示模型推理的最佳方式之一。而 Kimi 今天發布的視覺思考模型 k1 ,基于強大的基礎模型,就從答案輸出的長文本能力體現了其在多模態推理上的躍升。值得注意的是,這也是國內首個視覺思考模型!不同于以往國內外發布的推理模型,k1 的推理能力有兩大優勢:一是數理化能力杰出,二是視覺識別與邏輯推理能力強強結合。首先,根據官方數據披露,在 k0-math 數學模型的基礎上,k1 的能力不僅擴大到了數學領域中的幾何圖形方向,還增加了物理、化學等基礎科學能力。在基礎教育各階段的幾何和圖形題專項基準能力測試中,k1-preview 成績打平或超過了 OpenAI 的 o1 模型:結合端到端圖像理解和深度思維鏈推理技術,在數學、物理、化學等基礎教育學科的基準能力測試中,初代 k1 模型表現接近或超過 OpenAl o1、GPT-4o 以及 Claude 3.5 Sonnet 等領先視覺模型,達到了全球一流水平:此外,k1 還具備超強的視覺識別能力,并將視覺識別能力與語言推理能力強強結合!k1 可以準確識別強噪聲干擾下拍攝的圖片信息,包括但不限于灰暗燈光下拍攝、拍攝有陰影、拍攝書本彎折起伏、拍攝模糊或虛化、有手寫字跡干擾等等傳統視覺識別也難以解決的場景:在推理模型的實際應用中,除了文本識別,涉及到公式與圖形的理工類圖文信息識別往往是用戶直接拍照輸入解答。傳統基于文本的推理模型,或者不支持圖像信息輸入,或者需要借助外部 OCR/視覺模型進行轉換,效果有明顯損失。而 k1 的視覺部分針對這一問題進行了顯著改善。據 AI 科技評論了解,學生群體一直是 Kimi 用戶數最廣的群體之一,更是 Kimi 崛起的重要幕后推手之一。本次 k1 的視覺思考能力,精準捕捉了學生拍照識題并深度解讀的需求,將成為掃描王等產品的強有力競爭對手!基準測試數據顯示,在復雜拍攝條件下,例如照片圖像不清晰、多題一起拍、手寫字跡干擾,甚至純手寫的題目等場景,k1 模型相比 OpenAI 和 Anthropic 的視覺思考模型,有更顯著的領先優勢:2k1 掀起科學家手稿識別風相較 k0 的數學能力,k1 解鎖數理化并結合視覺識別與推理的能力,顯然擁有更廣闊的應用場景。其中,最震撼的是 k1 居然能解讀諾貝爾獎級別的科學家研究手稿或筆記!除了開頭的楊振寧手稿,k1 的發布還掀起了一批對伽利略、錢學森等科學家的手稿識別風:先看伽利略的天文學研究。輸入一張伽利略的意大利語筆記圖片:詢問 k1:請一步步推測一下這個筆記的作者是誰,筆記內容在講什么?k1 的回答如下:上下滑動查看長圖答案簡直逆天有木有!k1 視覺模型的體驗入口已經放在 Kimi 首頁,為此小編也抓緊去體驗了一下來自科學家的大腦暴擊!接著我又去網上找了幾張科學家的手稿照片,這是錢學森的:我心想圖片這么模糊、字跡這么別具一格,k1 總該難倒了吧,結果,k1 不僅精確識別!還邏輯清晰!振振有詞!上下滑動查看長圖對于爾等文科生來說,這就好像能帶計算機進考場考數學一樣,以后行走江湖豈不是輕輕松松縱橫四海?(狗頭護身)看到 k1 這么輕松就能解答復雜的數理化研究筆記,小編又忍不住思考:k1 能解答科學家手稿,那能解答抽象的現代美術展館的藝術展品嗎?讓我來試試。輸入莫奈的《睡蓮》,k1 解讀依然完美:上下滑動查看長圖不過,當我輸入莫奈另一幅由于戰亂輾轉導致殘缺的《睡蓮》畫作與今年香港巴塞爾藝術展上頗受關注的油彩筆所畫真人畫作時,k1 的表現則沒有解讀科學家筆記時那么深刻、嚴謹,原因或許是因為訓練數據不足。但在對未知或不那么熟悉的知識領域,k1 也能以擬人、優美的文字表達,展示一步一步思考問題的能力:輸入莫奈殘缺版睡蓮:k1 的解讀如下:上下滑動查看長圖在處理包含復雜信息的圖像上,k1 的能力無疑是當前國產模型的先鋒,尤其在包含復雜公式與幾何圖形的數理化問題上。相比藝術作品,后者更能體現底層模型的邏輯推理能力。而從用戶的體驗角度評價,由于 k1 結合了思維鏈與長文本技術,無論面對理科還是文科問題時都能給出一份展示完整思考過程的答案,在人機交互的產品創新上依然能給我們帶來新意。3月之暗面的 AGI 進階之路大模型沖刺 AGI 的下一步趨勢,主要有三塊:多模態、推理與 AI 的自我學習。這三塊中的每一塊難題攻關,都是挑戰重重;而 k1 的發布,至少體現了月之暗面攻克 AGI 的兩個重大命題,即多模態與推理,更是難上加難,尤其 k1 將兩者結合,無論是技術還是產品上都體現出了月之暗面團隊持續的創新能力。今年下半年起,月之暗面在 Kimi 產品上頻頻推出新功能:10 月,Kimi探索版革新「AI搜索」,強調AI的自助搜索能力,瞄準傳統搜索引擎的弊端,解決了大量 AI 搜索不痛不癢「拼湊大量信息」問題,重新定義了「AI搜索」。11 月,上個月的今天月之暗面發布了數學模型 k0-math,其數學能力對標 OpenAI o1 系列。12 月,今天月之暗面在 k0-math 模型的基礎上再推出視覺思考模型k1,數理化能力再上一個臺階。可以看到,這家大模型公司正在以月為單位的速度推出新技術、更新Kimi產品細節。一年前,月之暗面發布了支持輸入 20 萬漢字的智能助手產品 Kimi,創造了 C 端 AI 所支持的上下文輸入長度的新紀錄,以「長文本」策略一舉打響了 C 端 AI 產品市場,贏得一大批用戶,也給其他大模型公司帶來不小壓力。之后,Kimi的產品能力和技術實力萬眾期待,整個業界都在期待 Kimi 的下一個動作會是什么,但在之后的整整十一個月里,Kimi都沒有任何新的技術發布。而在這段時間里,Sora、GPT-4o、GPT-o1等現象級產品一次次點燃大眾的熱情,整個大模型領域都在跟進,每天誰家又做出來「類 Sora」 產品、誰家又超過GPT-4o……好不熱鬧。在GPT-o1發布后,其推理能力驚艷,主要體現在數學與編程上。這不僅涉及到思維鏈的 scale-up,模型推理能力的數據來源、以及背后的訓練方法也十分關鍵。早在今年 4月底清華人工智能學院的成立大會上,多模態方向領先研究者、京東技術副總裁何曉冬就預測過,下一代大模型的訓練大概率是通過模型生成的數據和標注、以及模型互相對抗這條“類強化學習”技術路線來推進。k0-math 發布時,楊植麟也提出,基于強化學習的 scale-up 比簡單預測下一個 token更能提升 AI 模型的思考能力,他認為多模態最重要的也是思考與交互,但思考的重要性遠大于交互,思考決定了上限。基干強化學習技術,AI模型具備像人一樣思考的潛力:在遇到問題時,首先分析問題,并提出不同的解法,然后根據不同的解法進行不斷試驗、反思并改進。自 AlphaGo 開始,深度強化學習一直被視為實現 AGI 的關鍵路徑之一。但在過去,由于深度強化學習有兩大缺陷:一是樣本效率與計算效率低,二是算法安全性與魯棒性低,其不適用于解決現實世界中交通、醫療、金融等關鍵領域的智能決策問題,因為這些領域的容錯率低、一旦出錯則風,險極高。但大模型時代到來后,結合大模型的語義理解與 2022 年出現的思維鏈技術后,強化學習有了新的生命。通過在大模型產品交互中引入強化學習的過程獎勵機制,對模型的推理過程進行逐步激勵與懲罰,激勵模型生成更詳細、質是更高的推理過程。Kimi 將基于強化學習技術的新一代模型,稱為“思考模型”。這是月之暗面創始人楊植麟技術路線思考的直觀體現。而在明確強化學習與AI思考能力放下之前,月之暗面也經歷過戰略調整,但最終決定要聚焦,聚焦Kimi。楊植麟稱,這是他們主動做了業務減法的結果,聚焦去做離 AGI 上限最高的事情,然后做好。從 k0 到 k1,月之暗面都給國內的大模型發展帶來了驚喜,k1 之后,k2、k3、k4…會如何迭代呢?作為技術的領跑者,Kimi 正在定義屬于自己的 AGI 路線。更多內容,點擊下方關注:未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        91电影在线观看| 国产成人在线看| 日产国产欧美视频一区精品| 成人av在线资源| 国产拍欧美日韩视频二区| 国内成人免费视频| 久久精品夜夜夜夜久久| 成人免费高清视频在线观看| 国产精品久久久久久户外露出| voyeur盗摄精品| 亚洲已满18点击进入久久| 欧美福利视频导航| 国产精品一区在线| 亚洲欧洲美洲综合色网| 欧美少妇bbb| 国产真实精品久久二三区| 国产精品久久久久久久久果冻传媒| 99精品久久只有精品| 日韩电影在线一区二区| 国产视频一区二区三区在线观看| 成人蜜臀av电影| 日韩不卡一二三区| 国产精品另类一区| 欧美一区二区三区在线观看视频 | 久久国产福利国产秒拍| 欧美国产日本韩| 欧美久久一二三四区| 成人免费视频网站在线观看| 亚洲成人免费视频| 国产亚洲制服色| 91精品国产综合久久精品性色| 成人一区在线观看| 久久国产综合精品| 亚洲小说欧美激情另类| 国产精品伦一区二区三级视频| 日韩免费观看高清完整版| 色视频欧美一区二区三区| 国产在线观看一区二区| 婷婷久久综合九色综合绿巨人 | 亚洲第一福利视频在线| 日本一区二区综合亚洲| 欧美高清激情brazzers| 91极品视觉盛宴| 99视频超级精品| 国产盗摄精品一区二区三区在线| 亚洲va欧美va国产va天堂影院| 国产精品青草久久| 久久精品综合网| 精品日韩在线观看| 91精品国产综合久久香蕉麻豆 | 欧美肥妇free| 欧美日韩免费一区二区三区视频 | 日韩欧美国产综合一区| 欧美午夜理伦三级在线观看| 91麻豆成人久久精品二区三区| 国产成人精品免费一区二区| 激情综合一区二区三区| 日本不卡在线视频| 日本伊人色综合网| 日韩电影一区二区三区四区| 午夜在线成人av| 亚洲国产精品自拍| 五月天一区二区| 日本伊人午夜精品| 久久精品国产成人一区二区三区 | 亚洲香肠在线观看| 亚洲电影在线播放| 日本中文字幕不卡| 日韩一区欧美二区| 麻豆成人久久精品二区三区小说| 日韩精品一二三| 蜜桃免费网站一区二区三区 | 亚洲视频一区在线观看| 亚洲三级在线播放| 丝袜国产日韩另类美女| 毛片av中文字幕一区二区| 国内国产精品久久| 99久久免费视频.com| 在线观看91视频| 欧美丰满嫩嫩电影| 国产亚洲一二三区| 亚洲男人的天堂一区二区| 日韩国产在线观看| 国产精品影视网| 91欧美一区二区| 欧美日韩国产片| 精品美女被调教视频大全网站| 国产日韩欧美综合在线| 一区二区三区在线视频免费| 蜜臀久久99精品久久久久久9| 国产1区2区3区精品美女| 欧美在线观看禁18| 久久色.com| 亚洲成人av中文| 国产精品一卡二卡| 色成年激情久久综合| 欧美v日韩v国产v| 亚洲免费高清视频在线| 精品中文字幕一区二区小辣椒| 成人高清伦理免费影院在线观看| 欧美专区在线观看一区| 国产香蕉久久精品综合网| 亚洲国产精品综合小说图片区| 国产伦理精品不卡| 欧美久久久久免费| 亚洲欧美日韩在线播放| 国产一区二区导航在线播放| 91成人免费在线视频| 久久久国际精品| 青青草精品视频| 日本精品一区二区三区高清 | 中文字幕在线观看一区二区| 蜜臀a∨国产成人精品| 91久久一区二区| 日本一区二区三区高清不卡| 日韩高清不卡在线| 欧美亚洲丝袜传媒另类| 亚洲日本免费电影| 国产91露脸合集magnet| 精品国产精品网麻豆系列| 亚洲va韩国va欧美va精品| 91色视频在线| 亚洲视频一二三| proumb性欧美在线观看| 国产欧美日韩不卡免费| 成人自拍视频在线| 国产精品色在线观看| 国产白丝网站精品污在线入口| 精品久久久久av影院| 老司机精品视频在线| 日韩区在线观看| 乱一区二区av| 精品国产91久久久久久久妲己| 蜜臂av日日欢夜夜爽一区| 欧美一二三四区在线| 美女www一区二区| 久久久三级国产网站| 高清在线不卡av| 国产精品欧美久久久久一区二区| 岛国精品在线观看| 18欧美亚洲精品| 色狠狠av一区二区三区| 亚洲第一会所有码转帖| 91精品国产综合久久香蕉的特点| 天堂蜜桃一区二区三区| 日韩三级视频在线观看| 国产精品一区二区果冻传媒| 中文字幕国产一区| 99视频国产精品| 性做久久久久久久免费看| 欧美猛男gaygay网站| 精品一区二区综合| 中文字幕一区二区日韩精品绯色| 色综合一个色综合亚洲| 亚洲va中文字幕| 久久精品一二三| 欧美婷婷六月丁香综合色| 久久精品av麻豆的观看方式| 亚洲国产精华液网站w| 色屁屁一区二区| 久久成人精品无人区| 国产精品美女久久久久av爽李琼| 欧美自拍偷拍午夜视频| 国产在线日韩欧美| 一个色在线综合| 久久五月婷婷丁香社区| 日本精品一区二区三区四区的功能| 日韩av不卡在线观看| 中文字幕乱码久久午夜不卡| 欧美日韩国产在线播放网站| 粉嫩aⅴ一区二区三区四区| 亚洲高清免费一级二级三级| 精品99999| 欧美电影影音先锋| 99精品在线免费| 韩国女主播成人在线| 亚洲美女一区二区三区| 久久久久久久久久看片| 欧美日韩一区不卡| 99久久国产综合色|国产精品| 日韩高清国产一区在线| 亚洲日本成人在线观看| 欧美mv和日韩mv国产网站| 91福利视频久久久久| 成人h版在线观看| 久久精品av麻豆的观看方式| 亚洲黄色尤物视频| 国产喷白浆一区二区三区| 日韩色在线观看| 欧美麻豆精品久久久久久| 91美女片黄在线观看| 国产不卡视频一区| 黄页网站大全一区二区| 日韩精品成人一区二区在线| 一二三四社区欧美黄| 中文字幕亚洲欧美在线不卡| 久久久久高清精品| 久久亚洲一级片| 久久众筹精品私拍模特| 日韩欧美aaaaaa|