標簽:視覺

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

港科大具身機器人團隊,連續獲億級融資

允小中 發自 凹非寺量子位 | 公眾號 QbitAI又一具身智能公司,對外官宣完成新融資—— 戴盟機器人,港科大創業團隊,連續完成兩輪億元級人民幣的天使+輪融資。 ...
閱讀原文

多模態大模型系列:Qwen-VL解讀及其實戰(以配圖文案生成為例)

大會預告12月5日-6日,智猩猩共同主辦的2024中國生成式AI大會(上海站)將舉辦。銀河通用機器人合伙人張直政、騰訊優圖實驗室天衍研究中心負責人吳賢、上海科...
閱讀原文

vivo影像規劃預研部研究員官善琰:基于視覺的物理規律反演研究 | 講座預告

文本到圖像的擴散模型在文本提示的指導下展示了前所未有的創作能力,例如在視覺藝術、合成數據集構建以及市場營銷和廣告中的圖像編輯等創意工作。然而,基于...
閱讀原文

Meta最新觸覺機械手登Science子刊封面,操作未知物體精度最高提升94%

奇月 發自 凹非寺量子位 | 公眾號 QbitAI現在,隨便丟給機械手一個陌生物體,它都可以像人類一樣輕松拿捏了—— 除了蘋果,罐頭、樂高積木、大象玩偶、骰子,都...
閱讀原文

穹徹智能-上交大最新Nature子刊速遞:解析深度學習驅動的視觸覺動態重建方案

機器之心發布 機器之心編輯部隨著人形機器人技術的迅猛發展,如何有效獲取高質量的操作數據成為核心挑戰。鑒于人類操作行為的復雜性和多樣性,如何從真實世界...
閱讀原文

開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版

VSA團隊 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。 港中文MMLab、上海AI Lab、騰訊團隊簡易實現了Vision Search Assistant,...
閱讀原文

空間智能版ImageNet來了!李飛飛吳佳俊團隊出品

衡宇 發自 凹非寺量子位 | 公眾號 QbitAI空間智能版ImageNet來了,來自斯坦福李飛飛吳佳俊團隊! HourVideo,一個用于評估多模態模型對長達一小時視頻理解能...
閱讀原文

不讓視覺語言模型「盲猜」,性能竟直接提升一倍?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

英偉達發布視覺AI Agent,能用AI總結真實世界了

大會預告12月5日-6日,2024中國生成式AI大會(上海站)舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側生成式AI、AI視頻生成和具身智能等議題進行同臺分享...
閱讀原文

視覺定位新SOTA!華人團隊開源革新框架SegVG,邊界框轉為分割信號 | ECCV 2024

新智元報道編輯:LRST 【新智元導讀】SegVG是一種新的視覺定位方法,通過將邊界框注釋轉化為像素級分割信號來增強模型的監督信號,同時利用三重對齊模塊解決...
閱讀原文

無需參數訪問!CMU用大模型自動優化視覺語言提示詞 | CVPR’24

林之秋 投稿量子位 | 公眾號 QbitAI視覺語言模型(如 GPT-4o、DALL-E 3)通常擁有數十億參數,且模型權重不公開,使得傳統的白盒優化方法(如反向傳播)難以...
閱讀原文

清華大學最新!2萬字長文全面解讀多模態生成式AI的前世今生!

點擊下方卡片,關注“AI生成未來”后臺回復“GAI”,免費獲取最新AI相關行業報告和資料! 作者:Hong Chen等 解讀:AI生成未來 文章鏈接:https://arxiv.org/pdf/...
閱讀原文

開源視頻生成天花板?最強攪局者Mochi 1免費直出電影級特效

新智元報道編輯:alan 【新智元導讀】AI視頻生成領域最強攪局者,她來了!影視級效果免費開源,真「賽博菩薩」。AI視頻生成賽道最強攪局者,來了! 何謂攪局...
閱讀原文

解決原生MLLM災難性遺忘問題!上海AI Lab提出原生多模態大模型Mono-InternVL | 博士后研究員羅根講座預告

現有的多模態大模型(MLLM)通常將預訓練的視覺編碼器與大語言模型結合來實現,即模塊化MLLM。最近新興的Chameleon、EVE等原生MLLM,將視覺感知和多模態理解...
閱讀原文

AI讓手機任務自動“跑”起來!我國高校最新研究,簡化移動設備操作

MOE KLINNS Lab投稿量子位 | 公眾號 QbitAIAI解放碳基生物雙手,甚至能讓你的手機自己玩自己! 你沒聽錯——這其實就是移動任務自動化。 在AI飛速發展下,這逐...
閱讀原文
12320