標(biāo)簽:視覺

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會,然后抓住它。 接觸過很多咨詢項目的人,發(fā)現(xiàn)...

港科大具身機(jī)器人團(tuán)隊,連續(xù)獲億級融資

允小中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI又一具身智能公司,對外官宣完成新融資—— 戴盟機(jī)器人,港科大創(chuàng)業(yè)團(tuán)隊,連續(xù)完成兩輪億元級人民幣的天使+輪融資。 ...
閱讀原文

多模態(tài)大模型系列:Qwen-VL解讀及其實戰(zhàn)(以配圖文案生成為例)

大會預(yù)告12月5日-6日,智猩猩共同主辦的2024中國生成式AI大會(上海站)將舉辦。銀河通用機(jī)器人合伙人張直政、騰訊優(yōu)圖實驗室天衍研究中心負(fù)責(zé)人吳賢、上海科...
閱讀原文

vivo影像規(guī)劃預(yù)研部研究員官善琰:基于視覺的物理規(guī)律反演研究 | 講座預(yù)告

文本到圖像的擴(kuò)散模型在文本提示的指導(dǎo)下展示了前所未有的創(chuàng)作能力,例如在視覺藝術(shù)、合成數(shù)據(jù)集構(gòu)建以及市場營銷和廣告中的圖像編輯等創(chuàng)意工作。然而,基于...
閱讀原文

Meta最新觸覺機(jī)械手登Science子刊封面,操作未知物體精度最高提升94%

奇月 發(fā)自 凹非寺量子位 | 公眾號 QbitAI現(xiàn)在,隨便丟給機(jī)械手一個陌生物體,它都可以像人類一樣輕松拿捏了—— 除了蘋果,罐頭、樂高積木、大象玩偶、骰子,都...
閱讀原文

穹徹智能-上交大最新Nature子刊速遞:解析深度學(xué)習(xí)驅(qū)動的視觸覺動態(tài)重建方案

機(jī)器之心發(fā)布 機(jī)器之心編輯部隨著人形機(jī)器人技術(shù)的迅猛發(fā)展,如何有效獲取高質(zhì)量的操作數(shù)據(jù)成為核心挑戰(zhàn)。鑒于人類操作行為的復(fù)雜性和多樣性,如何從真實世界...
閱讀原文

開源版SearchGPT來了,兩張3090就可復(fù)現(xiàn),超越Perplexity付費版

VSA團(tuán)隊 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。 港中文MMLab、上海AI Lab、騰訊團(tuán)隊簡易實現(xiàn)了Vision Search Assistant,...
閱讀原文

空間智能版ImageNet來了!李飛飛吳佳俊團(tuán)隊出品

衡宇 發(fā)自 凹非寺量子位 | 公眾號 QbitAI空間智能版ImageNet來了,來自斯坦福李飛飛吳佳俊團(tuán)隊! HourVideo,一個用于評估多模態(tài)模型對長達(dá)一小時視頻理解能...
閱讀原文

不讓視覺語言模型「盲猜」,性能竟直接提升一倍?

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

英偉達(dá)發(fā)布視覺AI Agent,能用AI總結(jié)真實世界了

大會預(yù)告12月5日-6日,2024中國生成式AI大會(上海站)舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側(cè)生成式AI、AI視頻生成和具身智能等議題進(jìn)行同臺分享...
閱讀原文

視覺定位新SOTA!華人團(tuán)隊開源革新框架SegVG,邊界框轉(zhuǎn)為分割信號 | ECCV 2024

新智元報道編輯:LRST 【新智元導(dǎo)讀】SegVG是一種新的視覺定位方法,通過將邊界框注釋轉(zhuǎn)化為像素級分割信號來增強模型的監(jiān)督信號,同時利用三重對齊模塊解決...
閱讀原文

無需參數(shù)訪問!CMU用大模型自動優(yōu)化視覺語言提示詞 | CVPR’24

林之秋 投稿量子位 | 公眾號 QbitAI視覺語言模型(如 GPT-4o、DALL-E 3)通常擁有數(shù)十億參數(shù),且模型權(quán)重不公開,使得傳統(tǒng)的白盒優(yōu)化方法(如反向傳播)難以...
閱讀原文

清華大學(xué)最新!2萬字長文全面解讀多模態(tài)生成式AI的前世今生!

點擊下方卡片,關(guān)注“AI生成未來”后臺回復(fù)“GAI”,免費獲取最新AI相關(guān)行業(yè)報告和資料! 作者:Hong Chen等 解讀:AI生成未來 文章鏈接:https://arxiv.org/pdf/...
閱讀原文

開源視頻生成天花板?最強攪局者M(jìn)ochi 1免費直出電影級特效

新智元報道編輯:alan 【新智元導(dǎo)讀】AI視頻生成領(lǐng)域最強攪局者,她來了!影視級效果免費開源,真「賽博菩薩」。AI視頻生成賽道最強攪局者,來了! 何謂攪局...
閱讀原文

解決原生MLLM災(zāi)難性遺忘問題!上海AI Lab提出原生多模態(tài)大模型Mono-InternVL | 博士后研究員羅根講座預(yù)告

現(xiàn)有的多模態(tài)大模型(MLLM)通常將預(yù)訓(xùn)練的視覺編碼器與大語言模型結(jié)合來實現(xiàn),即模塊化MLLM。最近新興的Chameleon、EVE等原生MLLM,將視覺感知和多模態(tài)理解...
閱讀原文

AI讓手機(jī)任務(wù)自動“跑”起來!我國高校最新研究,簡化移動設(shè)備操作

MOE KLINNS Lab投稿量子位 | 公眾號 QbitAIAI解放碳基生物雙手,甚至能讓你的手機(jī)自己玩自己! 你沒聽錯——這其實就是移動任務(wù)自動化。 在AI飛速發(fā)展下,這逐...
閱讀原文
12320