<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Gemini Robotics

        AI工具4個(gè)月前更新 AI工具集
        760 0 0

        Gemini Robotics – 谷歌 DeepMind 推出的具身智能大模型

        Gemini Robotics是什么

        Gemini Robotics 是由谷歌 DeepMind 推出的一個(gè)基于 Gemini 2.0 的機(jī)器人項(xiàng)目,旨在將大型多模態(tài)模型的能力應(yīng)用于物理環(huán)境。該項(xiàng)目包含兩個(gè)核心模型:Gemini Robotics-ER 和 Gemini Robotics。其中,Gemini Robotics-ER 是一種增強(qiáng)版的視覺(jué)-語(yǔ)言模型(VLM),具備卓越的具身推理能力,能夠理解三維空間、進(jìn)行物體檢測(cè)、指向、軌跡預(yù)測(cè)及抓取等任務(wù)。而 Gemini Robotics 則是視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,能夠直接控制機(jī)器人完成復(fù)雜操作,展現(xiàn)出對(duì)物體類型和位置變化的強(qiáng)大適應(yīng)性,并能夠執(zhí)行開(kāi)放詞匯的指令。經(jīng)過(guò)進(jìn)一步的微調(diào),Gemini Robotics 能夠應(yīng)對(duì)長(zhǎng)時(shí)域、高靈活性的任務(wù),如折紙或玩牌,并快速適應(yīng)新任務(wù)和不同的機(jī)器人形態(tài)。

        Gemini Robotics

        Gemini Robotics的主要功能

        • 智能對(duì)話與復(fù)雜任務(wù)執(zhí)行能力
          • 高靈活性任務(wù):包括折紙、玩牌和使用工具等。
          • 長(zhǎng)時(shí)域任務(wù):如打包午餐盒、制作三明治等多步驟操作。
          • 精細(xì)化操作:如使用鑷子夾取小物體、擰緊瓶蓋等。
        • 強(qiáng)大的視覺(jué)和語(yǔ)言理解能力
          • 視覺(jué)理解:能夠識(shí)別和定位場(chǎng)景中的物體,支持多視角理解、三維空間推理和物體檢測(cè)。
          • 語(yǔ)言理解:能夠理解自然語(yǔ)言指令,并執(zhí)行開(kāi)放詞匯任務(wù)。
        • 環(huán)境適應(yīng)與泛化能力
          • 視覺(jué)泛化:對(duì)于場(chǎng)景中的背景、光照和干擾物體變化具有強(qiáng)大的適應(yīng)能力。
          • 動(dòng)作泛化:能夠適應(yīng)物置和不同物體實(shí)例的變化。
          • 指令泛化:理解指令的多種表達(dá)方式,包括不同語(yǔ)言和拼寫錯(cuò)誤的指令。

        Gemini Robotics的技術(shù)原理

        • Gemini 2.0 基礎(chǔ)模型:基于 Gemini 2.0 的擴(kuò)展,提供強(qiáng)大的視覺(jué)和語(yǔ)言理解能力。
        • 具身推理:Gemini Robotics-ER 是 Gemini Robotics 的擴(kuò)展版本,專注于具身推理,支持理解物理世界中的三維空間、物體關(guān)系和軌跡。
        • 視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型
          • 視覺(jué)輸入:通過(guò)攝像頭獲取場(chǎng)景圖像,識(shí)別物體和環(huán)境。
          • 語(yǔ)言指令:理解自然語(yǔ)言指令,并將其轉(zhuǎn)化為具體的機(jī)器人動(dòng)作。
          • 動(dòng)作輸出:生成機(jī)器人的動(dòng)作指令,實(shí)現(xiàn)復(fù)雜任務(wù)。
        • 數(shù)據(jù)驅(qū)動(dòng)的訓(xùn)練
          • 機(jī)器人動(dòng)作數(shù)據(jù):通過(guò)真實(shí)機(jī)器人的操作數(shù)據(jù),學(xué)習(xí)執(zhí)行各種任務(wù)。
          • 非機(jī)器人數(shù)據(jù):包括網(wǎng)絡(luò)圖像、文本、視頻等,提供豐富的背景知識(shí)和泛化能力。
        • 架構(gòu)設(shè)計(jì)
          • 云端 VLA 主干網(wǎng)絡(luò):負(fù)責(zé)處理復(fù)雜的視覺(jué)和語(yǔ)言推理任務(wù)。
          • 本地動(dòng)作解碼器:在機(jī)器人本地運(yùn)行,負(fù)責(zé)實(shí)時(shí)生成動(dòng)作指令,確保低延遲和高響應(yīng)性。

        Gemini Robotics的項(xiàng)目地址

        Gemini Robotics的應(yīng)用場(chǎng)景

        • 工業(yè)制造:用于復(fù)雜的裝配、質(zhì)量檢測(cè)和維修,提升生產(chǎn)效率和精度。
        • 物流倉(cāng)儲(chǔ):實(shí)現(xiàn)貨物的分揀、包裝和裝卸自動(dòng)化,提高物流效率。
        • 家庭服務(wù):協(xié)助家庭事務(wù),如整理、清潔以及照顧老年人或殘疾人。
        • 醫(yī)療健康:輔助康復(fù)訓(xùn)練和手術(shù)操作,支持醫(yī)療流程。
        • 教育科研:作為教育工具和科研助手,支持教學(xué)和實(shí)驗(yàn)操作。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 污污视频网站免费观看| 亚洲色成人网一二三区| 在线观看免费视频资源| 亚洲精品456人成在线| 97性无码区免费| 美女被羞羞网站免费下载| 日本永久免费a∨在线视频| 好吊妞998视频免费观看在线| 亚洲人成网www| 国产精品亚洲片在线花蝴蝶| 亚洲第一成年免费网站| 国产成人亚洲合集青青草原精品| 亚洲综合激情五月丁香六月| 黄瓜视频高清在线看免费下载 | 四虎一区二区成人免费影院网址| 国产午夜无码视频免费网站| 久久亚洲中文字幕无码| 免费在线观看a级毛片| 人妖系列免费网站观看| 亚洲AV无码乱码在线观看裸奔| 久久亚洲最大成人网4438| 在线观看无码AV网站永久免费| 亚洲成aⅴ人片久青草影院按摩| 韩国欧洲一级毛片免费| 黄网站在线播放视频免费观看| 久久亚洲色一区二区三区| 免费福利电影在线观看| 亚洲午夜在线电影| 黄色片在线免费观看| 久久精品国产精品亚洲艾| 69堂人成无码免费视频果冻传媒 | 国产午夜亚洲精品不卡电影| 国产精品亚洲不卡一区二区三区| 国产高清不卡免费视频| 中日韩亚洲人成无码网站| 亚洲成人国产精品| 9420免费高清在线视频| 亚洲AV无码一区二区三区鸳鸯影院| 18禁成人网站免费观看| 久久亚洲AV成人无码国产最大| 亚洲精品乱码久久久久66|