標(biāo)簽：視覺

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經(jīng)常用來日常寫作，雖然本身提供了AI功能，但可惜需要會員，本文教你三分鐘接入最火的DeepSeek，讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址：http:/...

閱讀原文

AI教程

9個月前

AI賺錢副業(yè)~AI生成影視解說，半個月漲粉變現(xiàn)3.5W+！

這兩年大家都在感嘆生活不易，然而我想說的是，機(jī)會還是有的，但問題不在于有沒有，而在于你是否能夠認(rèn)準(zhǔn)機(jī)會，然后抓住它。接觸過很多咨詢項目的人，發(fā)現(xiàn)...

使用教程

1年前 (2024)

港科大具身機(jī)器人團(tuán)隊，連續(xù)獲億級融資

允小中發(fā)自凹非寺量子位 | 公眾號 QbitAI又一具身智能公司，對外官宣完成新融資—— 戴盟機(jī)器人，港科大創(chuàng)業(yè)團(tuán)隊，連續(xù)完成兩輪億元級人民幣的天使+輪融資。 ...

閱讀原文

AIGC動態(tài)

1年前 (2024)

多模態(tài)大模型系列：Qwen-VL解讀及其實戰(zhàn)(以配圖文案生成為例)

大會預(yù)告12月5日-6日，智猩猩共同主辦的2024中國生成式AI大會（上海站）將舉辦。銀河通用機(jī)器人合伙人張直政、騰訊優(yōu)圖實驗室天衍研究中心負(fù)責(zé)人吳賢、上海科...

閱讀原文

AIGC動態(tài)

1年前 (2024)

vivo影像規(guī)劃預(yù)研部研究員官善琰：基于視覺的物理規(guī)律反演研究 | 講座預(yù)告

文本到圖像的擴(kuò)散模型在文本提示的指導(dǎo)下展示了前所未有的創(chuàng)作能力，例如在視覺藝術(shù)、合成數(shù)據(jù)集構(gòu)建以及市場營銷和廣告中的圖像編輯等創(chuàng)意工作。然而，基于...

閱讀原文

AIGC動態(tài)

1年前 (2024)

Meta最新觸覺機(jī)械手登Science子刊封面，操作未知物體精度最高提升94%

奇月發(fā)自凹非寺量子位 | 公眾號 QbitAI現(xiàn)在，隨便丟給機(jī)械手一個陌生物體，它都可以像人類一樣輕松拿捏了—— 除了蘋果，罐頭、樂高積木、大象玩偶、骰子，都...

閱讀原文

AIGC動態(tài)

1年前 (2024)

穹徹智能-上交大最新Nature子刊速遞：解析深度學(xué)習(xí)驅(qū)動的視觸覺動態(tài)重建方案

機(jī)器之心發(fā)布機(jī)器之心編輯部隨著人形機(jī)器人技術(shù)的迅猛發(fā)展，如何有效獲取高質(zhì)量的操作數(shù)據(jù)成為核心挑戰(zhàn)。鑒于人類操作行為的復(fù)雜性和多樣性，如何從真實世界...

閱讀原文

AIGC動態(tài)

1年前 (2024)

開源版SearchGPT來了，兩張3090就可復(fù)現(xiàn)，超越Perplexity付費版

VSA團(tuán)隊投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天，開源版本也來了。港中文MMLab、上海AI Lab、騰訊團(tuán)隊簡易實現(xiàn)了Vision Search Assistant，...

閱讀原文

AIGC動態(tài)

1年前 (2024)

空間智能版ImageNet來了！李飛飛吳佳俊團(tuán)隊出品

衡宇發(fā)自凹非寺量子位 | 公眾號 QbitAI空間智能版ImageNet來了，來自斯坦福李飛飛吳佳俊團(tuán)隊！ HourVideo，一個用于評估多模態(tài)模型對長達(dá)一小時視頻理解能...

閱讀原文

AIGC動態(tài)

1年前 (2024)

不讓視覺語言模型「盲猜」，性能竟直接提升一倍？

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年，機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容，覆蓋全球各大高校與企業(yè)的頂級實驗室，有效促進(jìn)了學(xué)術(shù)...

閱讀原文

AIGC動態(tài)

1年前 (2024)

英偉達(dá)發(fā)布視覺AI Agent，能用AI總結(jié)真實世界了

大會預(yù)告12月5日-6日，2024中國生成式AI大會（上海站）舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側(cè)生成式AI、AI視頻生成和具身智能等議題進(jìn)行同臺分享...

閱讀原文

AIGC動態(tài)

1年前 (2024)

視覺定位新SOTA！華人團(tuán)隊開源革新框架SegVG，邊界框轉(zhuǎn)為分割信號 | ECCV 2024

新智元報道編輯：LRST 【新智元導(dǎo)讀】SegVG是一種新的視覺定位方法，通過將邊界框注釋轉(zhuǎn)化為像素級分割信號來增強模型的監(jiān)督信號，同時利用三重對齊模塊解決...

閱讀原文

AIGC動態(tài)

1年前 (2024)

無需參數(shù)訪問！CMU用大模型自動優(yōu)化視覺語言提示詞 | CVPR’24

林之秋投稿量子位 | 公眾號 QbitAI視覺語言模型（如 GPT-4o、DALL-E 3）通常擁有數(shù)十億參數(shù)，且模型權(quán)重不公開，使得傳統(tǒng)的白盒優(yōu)化方法（如反向傳播）難以...

閱讀原文

AIGC動態(tài)

1年前 (2024)

清華大學(xué)最新！2萬字長文全面解讀多模態(tài)生成式AI的前世今生！

點擊下方卡片，關(guān)注“AI生成未來”后臺回復(fù)“GAI”，免費獲取最新AI相關(guān)行業(yè)報告和資料！作者：Hong Chen等解讀：AI生成未來文章鏈接：https://arxiv.org/pdf/...

閱讀原文

AIGC動態(tài)

1年前 (2024)

開源視頻生成天花板？最強攪局者M(jìn)ochi 1免費直出電影級特效

新智元報道編輯：alan 【新智元導(dǎo)讀】AI視頻生成領(lǐng)域最強攪局者，她來了！影視級效果免費開源，真「賽博菩薩」。AI視頻生成賽道最強攪局者，來了！何謂攪局...

閱讀原文

AIGC動態(tài)

1年前 (2024)

解決原生MLLM災(zāi)難性遺忘問題！上海AI Lab提出原生多模態(tài)大模型Mono-InternVL | 博士后研究員羅根講座預(yù)告

現(xiàn)有的多模態(tài)大模型（MLLM）通常將預(yù)訓(xùn)練的視覺編碼器與大語言模型結(jié)合來實現(xiàn)，即模塊化MLLM。最近新興的Chameleon、EVE等原生MLLM，將視覺感知和多模態(tài)理解...

閱讀原文

AIGC動態(tài)

1年前 (2024)

AI讓手機(jī)任務(wù)自動“跑”起來！我國高校最新研究，簡化移動設(shè)備操作

MOE KLINNS Lab投稿量子位 | 公眾號 QbitAIAI解放碳基生物雙手，甚至能讓你的手機(jī)自己玩自己！你沒聽錯——這其實就是移動任務(wù)自動化。在AI飛速發(fā)展下，這逐...

閱讀原文

AIGC動態(tài)

1年前 (2024)

12 3…20