<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Cosmos-Reason1

        AI工具1個(gè)月前更新 AI工具集
        426 0 0

        Cosmos-Reason1 – NVIDIA推出的系列多模態(tài)大語言模型

        Cosmos-Reason1

        Cosmos-Reason1 是 NVIDIA 推出的一系列先進(jìn)的多模態(tài)大型語言模型,旨在通過物理常識(shí)和具身推理深入理解物理世界。該系列包含兩個(gè)不同規(guī)模的模型:Cosmos-Reason1-8B 和 Cosmos-Reason1-56B。它們能夠基于視覺輸入感知環(huán)境,并通過長(zhǎng)鏈思考生成自然語言的回答,提供解釋性見解和具身決策(例如,下一步行動(dòng))。

        Cosmos-Reason1是什么

        Cosmos-Reason1 是 NVIDIA 開發(fā)的多模態(tài)大型語言模型系列,專注于物理常識(shí)和具身推理,以更好地理解物理世界。該系列包括兩個(gè)版本:Cosmos-Reason1-8B 和 Cosmos-Reason1-56B。模型通過視覺輸入感知周圍世界,并在經(jīng)過復(fù)雜推理后生成自然語言響應(yīng),涵蓋深入的解釋和具身行動(dòng)決策。其訓(xùn)練過程分為四個(gè)主要階段:視覺預(yù)訓(xùn)練、通用監(jiān)督微調(diào)(SFT)、物理 AI 微調(diào)及強(qiáng)化學(xué)習(xí)。Cosmos-Reason1 在物理常識(shí)和具身推理的基準(zhǔn)測(cè)試中均展現(xiàn)出卓越性能,得益于精心設(shè)計(jì)的數(shù)據(jù)和強(qiáng)化學(xué)習(xí)策略。

        主要功能

        • 物理常識(shí)理解:掌握物理世界的基本原理,包括空間、時(shí)間及基礎(chǔ)物理定律,從而判斷的合理性。
        • 具身推理:為具身代理(如機(jī)器人和自動(dòng)駕駛車輛)提供基于物理常識(shí)的合理決策和行動(dòng)計(jì)劃。
        • 長(zhǎng)鏈思考:通過長(zhǎng)鏈思考(chain-of-thought reasoning)生成詳細(xì)的推理過程,以增強(qiáng)決策的透明性和可解釋性。
        • 多模態(tài)輸入處理:支持視頻輸入,結(jié)合視覺信息與語言指令進(jìn)行推理,并生成自然語言回答。

        技術(shù)原理

        • 層次化本體論:構(gòu)建物理常識(shí)的層次化本體論,涵蓋空間、時(shí)間和基礎(chǔ)物理三個(gè)主要類別,并細(xì)分為16個(gè)子類別。
        • 二維本體論:為具身推理專門設(shè)計(jì)的二維本體論,涵蓋五種具身代理的四種核心推理能力。
        • 多模態(tài)架構(gòu):采用解碼器主導(dǎo)的多模態(tài)架構(gòu),處理視覺輸入后與文本嵌入對(duì)齊,輸入到大型語言模型中。
        • 四個(gè)訓(xùn)練階段
          • 視覺預(yù)訓(xùn)練:對(duì)視覺與文本模態(tài)進(jìn)行對(duì)齊。
          • 通用監(jiān)督微調(diào)(SFT):提升模型在一般視覺語言任務(wù)中的表現(xiàn)。
          • 物理AI微調(diào):使用專門數(shù)據(jù)增強(qiáng)物理常識(shí)及具身推理能力。
          • 物理AI強(qiáng)化學(xué)習(xí)(RL):通過規(guī)則化獎(jiǎng)勵(lì)進(jìn)一步優(yōu)化模型的推理性能。
        • 強(qiáng)化學(xué)習(xí):設(shè)計(jì)基于多選題的規(guī)則化獎(jiǎng)勵(lì)機(jī)制,通過強(qiáng)化學(xué)習(xí)提升模型在物理常識(shí)和具身推理任務(wù)的表現(xiàn)。

        項(xiàng)目官網(wǎng)

        應(yīng)用場(chǎng)景

        • 機(jī)器人操作:協(xié)助機(jī)器人理解任務(wù)目標(biāo),生成操作計(jì)劃,實(shí)現(xiàn)抓取、組裝等復(fù)雜動(dòng)作。
        • 自動(dòng)駕駛:分析道路視頻,預(yù)測(cè)交通動(dòng)態(tài),生成安全駕駛決策,如避讓和變道。
        • 智能監(jiān)控:實(shí)時(shí)監(jiān)測(cè)視頻中的異常行為,如人員跌倒或設(shè)備故障,并及時(shí)發(fā)出警報(bào)。
        • 虛擬現(xiàn)實(shí)(VR)/增強(qiáng)現(xiàn)實(shí)(AR):根據(jù)虛擬環(huán)境輸入生成交互響應(yīng),提升用戶沉浸感。
        • 教育與培訓(xùn):通過視頻講解物理現(xiàn)象或操作流程,輔助教學(xué)和職業(yè)技能培訓(xùn)。

        常見問題

        • Cosmos-Reason1 能否處理實(shí)時(shí)視頻輸入? 是的,Cosmos-Reason1 支持實(shí)時(shí)視頻輸入,能夠根據(jù)視覺信息進(jìn)行推理。
        • 模型的訓(xùn)練過程是怎樣的? 訓(xùn)練過程包括視覺預(yù)訓(xùn)練、通用監(jiān)督微調(diào)、物理 AI 微調(diào)和強(qiáng)化學(xué)習(xí)四個(gè)階段。
        • Cosmos-Reason1 可以應(yīng)用于哪些領(lǐng)域? 該模型可廣泛應(yīng)用于機(jī)器人、自動(dòng)駕駛、智能監(jiān)控、虛擬現(xiàn)實(shí)和教育培訓(xùn)等多個(gè)領(lǐng)域。
        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評(píng)論

        暫無評(píng)論...
        主站蜘蛛池模板: 国产色爽免费无码视频| 久久久久亚洲精品无码网址色欲 | yellow视频免费看| 九九美女网站免费| 好爽…又高潮了毛片免费看| 日韩亚洲一区二区三区| 老司机午夜性生免费福利 | 老妇激情毛片免费| 亚洲毛片网址在线观看中文字幕| 特a级免费高清黄色片| 99久久人妻精品免费二区| 亚洲精品美女久久久久9999| 最刺激黄a大片免费网站| 久久久亚洲AV波多野结衣| 99re在线精品视频免费| 亚洲区视频在线观看| 成年私人影院免费视频网站| 亚洲爆乳精品无码一区二区| 亚洲A∨午夜成人片精品网站| 国产VA免费精品高清在线| 亚洲级αV无码毛片久久精品| 3344免费播放观看视频| 亚洲乱码一二三四区乱码| 日本免费观看网站| 国产福利电影一区二区三区,免费久久久久久久精 | 亚洲高清资源在线观看| 永久免费AV无码国产网站| 亚洲精华国产精华精华液网站| 免费在线黄色网址| 暖暖免费在线中文日本| 亚洲国产精品乱码在线观看97| 日本最新免费不卡二区在线| 色播在线永久免费视频网站| 亚洲毛片免费观看| 免费永久国产在线视频| 永久免费AV无码网站国产| 久久乐国产综合亚洲精品| 亚洲无线一二三四区手机| 16女性下面扒开无遮挡免费| 国产亚洲福利一区二区免费看| 久久精品国产亚洲av麻豆|