多模態(tài)大模型線上閉門會:通義實驗室/港中文/港科大三位學者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
AIGC動態(tài)歡迎閱讀
原標題:多模態(tài)大模型線上閉門會:通義實驗室/港中文/港科大三位學者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
關(guān)鍵字:模型,語言,達摩,視覺,猩猩
文章來源:算法邦
內(nèi)容字數(shù):5744字
內(nèi)容摘要:
智猩猩,由智東西公開課升級而來,定位硬科技講解與服務平臺,提供講座、線上閉門會、公開課、在線研討會、峰會等線上線下產(chǎn)品。
「線上閉門會」由智猩猩全新企劃,將持續(xù)邀請行業(yè)、領(lǐng)域?qū)<覔纬銎啡斯餐邉澇銎罚接懭斯ぶ悄堋⒆詣玉{駛領(lǐng)域中的最新技術(shù)研究與應用。2023 年可謂是多模態(tài)大模型爆發(fā)的元年。從OpenAI 的 GPT-4V,到谷歌的 Gemini,再到國內(nèi)眾多機構(gòu)發(fā)布的多模態(tài)大模型。大模型的能力已經(jīng)不僅僅局限于傳統(tǒng)的文本輸入和輸出,通過處理包括文本、圖像、音頻和視頻在內(nèi)的多種數(shù)據(jù)類型,使得它能夠執(zhí)行更加復雜和多樣化的任務,從而擴展到了圖像生成、視頻處理、文檔處理、語音識別和生成等領(lǐng)域。
多模態(tài)大模型是智猩猩重點關(guān)注的領(lǐng)域,今年也將持續(xù)深入挖掘?qū)W術(shù)界和工業(yè)界在多模態(tài)大模型上的研究進展和最新成果。1月17日晚7點,智猩猩推出「多模態(tài)大模型線上閉門會」。本次閉門會由阿里巴巴通義實驗室 NLP 高級算法專家嚴明參與出品,并聚焦于大語言模型工具調(diào)用 ControlLLM、長視頻理解視覺語言模型 LLaMA-VID和多模態(tài)文檔理解大模型 mPLUG-DocOwl。
出品人嚴明的主要研究方向為對話
原文鏈接:多模態(tài)大模型線上閉門會:通義實驗室/港中文/港科大三位學者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:「算法邦」,隸屬于智猩猩,關(guān)注大模型、生成式AI、計算機視覺三大領(lǐng)域的研究與開發(fā),提供技術(shù)文章、講座、在線研討會。