標簽:區域

無人出租車深圳中心區收費載客,硅谷同款,首獲資質

允中 發自 凹非寺量子位 | 公眾號 QbitAI最新消息,深圳寶安區已向AutoX安途頒發首批智能網聯汽車無人商業化試點資質,許可AutoX在寶安中心城區進行無人化Rob...
閱讀原文

擴散模型更懂復雜提示詞!Pika北大斯坦福開源新框架,利用LLM提升理解力

明敏 發自 凹非寺量子位 | 公眾號 QbitAIPika北大斯坦福聯手,開源最新文本-圖像生成/編輯框架! 無需額外訓練,即可讓擴散模型擁有更強提示詞理解能力。 面...
閱讀原文

Nature論文 “淺腦理論”:深度神經網絡或許不是下一代AI的核心架構?

導讀:最新的神經科學研究挑戰了傳統的認知,提出了“淺層大腦”假說,顛覆了傳統對大腦層級結構的理解。相較于深度學習和預測性編碼,這一新理論認為大腦架構...
閱讀原文

1張圖2分鐘轉3D!紋理質量、多視角一致性新SOTA|北大出品

張俊武 唐振宇 投稿量子位 | 公眾號 QbitAI只需兩分鐘,玩轉圖片轉3D! 還是高紋理質量、多視角高一致性的那種。 不管是什么物種,輸入時的單視圖圖像還是這...
閱讀原文

隨意指定CLIP關注區域!上交復旦等發布Alpha-CLIP:同時保持全圖+局部檢測能力

新智元報道編輯:LRS【新智元導讀】本文介紹了一個名為Alph-CLIP的框架,它在原始的接受RGB三通道輸入的CLIP模型的上額外增加了一個alpha通道。在千萬量級的R...
閱讀原文

信仰的歸信仰,商業的歸商業|AGI是信仰的游戲,還是商業的操縱?|這場鬧劇是GPT-5的內部覺醒,還是造物主的人性精妙設計?

點擊上方藍字關注我們圖:在這個月初的一個視頻訪談中,Ilya談到最新的GPT進展給他最震驚的突破是:當和GPT對話時,有那種被理解的感覺。“Elon Musk在周末的O...
閱讀原文

Uber 將 4000 多個微服務遷移到新的多云平臺 Up

作者 | Rafal Gancarz 譯者 | 明知山 策劃 | 丁曉昀 Uber 將其大部分容器化微服務從μDeploy 遷移到一個叫作 Up 的新多云平臺,準備將相當一部分計算遷移到云...
閱讀原文

在視覺提示中加入「標記」,微軟等讓GPT-4V看的更準、分的更細

機器之心報道編輯:杜偉、小舟全新視覺提示方法 SoM(Set-of-Mark),讓 OpenAI 多模態大模型 GPT-4V 在視覺內容理解方面有了質的提升。最近一段時間,我們見...
閱讀原文

AI搞定谷歌驗證碼,最新多模態大模型比GPT-4V空間理解更準確 | 蘋果AI/ML團隊

Michael 投稿自 凹非寺量子位 | 公眾號 QbitAI谷歌人機驗證已經攔不住AI了!最新多模態大模型,能輕松找到圖中所有交通信號燈,還準確圈出了具體位置。表現直...
閱讀原文

只動手不動口,或只動口不動手,你真能做到嗎?

機器之心編譯選自量子雜志編輯:Rome你是否注意過自己動手聚精會神做事情時會不自覺的伸出舌頭,又或者一些歌手經常會在唱歌的時候,手也會不自覺的在空中舞...
閱讀原文

無懼圖像中的文字,TextDiffuser提供更高質量文本渲染

機器之心專欄機器之心編輯部近幾年來,Text-to-Image 領域取得了巨大的進展,特別是在 AIGC(Artificial Intelligence Generated Content)的時代。隨著 DALL...
閱讀原文
12