標簽:視覺
多模態大模型,阿里通義千問能和GPT-4V掰手腕了
機器之心報道 編輯:澤南、蛋醬通義千問的圖像推理能力,最近有了大幅提升。 2024 年,大模型領域要卷什么? 如果沒有思路的話,不妨看看各家大廠都在押注什...
寒武紀與智象未來達成戰略合作并完成大模型適配
寒武紀與智象未來簽約儀式現場;左起:智象未來聯合創始人、COO王科;智象未來創始人、CEO梅濤;寒武紀創始人、CEO陳天石;寒武紀聯合創始人、執行總裁王在 ...
麻省理工研究表明AI不會像預期那樣搶走那么多工作
點擊上方藍字關注我們“麻省理工學院的研究揭示,雖然人工智能在各行業快速發展,但其在成本效益上替代大多數工作的可行性尚不明確。通過深入研究計算機視覺領...
視覺Mamba模型的Swin時刻,中國科學院、華為等推出VMamba
機器之心專欄 機器之心編輯部Transformer 在大模型領域的地位可謂是難以撼動。不過,這個AI 大模型的主流架構在模型規模的擴展和需要處理的序列變長后,局限...
GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類
新智元報道編輯:桃子 【新智元導讀】多模態大模型GPT-4V也會「有眼無珠」。UC San Diego紐約大學研究人員提出全新V*視覺搜索算法逆轉LLM弱視覺宿命。Sam Alt...
美團 AI 平臺視覺中心負責人魏曉林離職
作者丨賴文昕 編輯丨陳彩嫻雷峰網AI科技評論獨家獲悉:現任美團AI平臺視覺中心負責人魏曉林將離職,結束長達4年6個月的美團生涯。目前,其領英個人認證尚未做...
獨家 | 美團 AI 平臺視覺中心負責人魏曉林離職
美團 AI 視覺一號位魏曉林離開,誰能接過下一棒?作者丨賴文昕 編輯丨陳彩嫻 雷峰網AI科技評論獨家獲悉:現任美團AI平臺視覺中心負責人魏曉林將離職,結束長...
視覺Mamba來了:速度提升2.8倍,內存能省87%
機器之心報道 編輯:陳萍、澤南Vision Mamba 不是個普通模型。號稱「全面包圍 Transformer」的 Mamba,推出不到兩個月就有了高性能的視覺版。 本周四,來自華...
馬毅LeCun謝賽寧曝出多模態LLM重大缺陷!開創性研究顯著增強視覺理解能力
新智元報道編輯:潤 好困 【新智元導讀】來自紐約大學和UC伯克利的研究團隊成功捕捉到了多模態大模型在視覺理解方面存在的重大缺陷。針對這個問題,他們進一...
LMDrive: 大語言模型加持的閉環端到端自動駕駛框架
直播預告 | 1月22日晚7點,「自動駕駛新青年講座」第35講正式開講,LMDrive一作、香港中文大學MMLab在讀博士邵昊將主講《LMDrive:大語言模型加持的閉環端到...
機器人領域首個開源視覺-語言操作大模型,RoboFlamingo框架激發開源VLMs更大潛能
機器之心專欄 機器之心編輯部還在苦苦尋找開源的機器人大模型?試試RoboFlamingo! 近年來,大模型的研究正在加速推進,它逐漸在各類任務上展現出多模態的理...
擴散模型圖像理解力刷新SOTA!字節復旦團隊提出全新「元提示」策略
新智元報道編輯:好困 桃子 【新智元導讀】過去一年擴散模型風頭正勁,徹底改變了文生圖領域!那么,擴散模型能否處理視覺感知任務?字節跳動和復旦大學技術...
港中文在讀博士李彥瑋:LLaMA-VID: 專注于長視頻理解的視覺語言大模型
1月17日晚7點,智猩猩推出「多模態大模型線上閉門會」。本次閉門會由阿里巴巴通義實驗室 NLP 高級算法專家嚴明參與出品,并聚焦于大語言模型工具調用 Control...
視頻場景圖生成任務新SOTA!中山大學提出全新時空知識嵌入框架,登頂刊TIP'24
新智元報道編輯:LRS 好困 【新智元導讀】STKET框架將先驗時空知識納入多頭交叉注意機制中,從而可以學習到更多有代表性的視覺關系表示,在視頻圖生成基準上...
阿里通義實驗室高級算法工程師文束:mPLUG-DocOwl:多模態文檔理解大模型
1月17日晚7點,智猩猩推出「多模態大模型線上閉門會」。本次閉門會由阿里巴巴通義實驗室 NLP 高級算法專家嚴明參與出品,并聚焦于大語言模型工具調用 Control...