字節(jié)跳動馮佳時:大語言模型在計算機視覺領(lǐng)域的應(yīng)用、問題和我們的解法
AIGC動態(tài)歡迎閱讀
原標(biāo)題:字節(jié)跳動馮佳時:大語言模型在計算機視覺領(lǐng)域的應(yīng)用、問題和我們的解法
關(guān)鍵字:模型,字節(jié)跳動,圖像,語言,視覺
文章來源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
演講嘉賓|馮佳時
編輯 |蔡芳芳
策劃 | AICon 全球人工智能開發(fā)與應(yīng)用大會
近年來,大語言模型 (LLMs) 在文本理解與生成領(lǐng)域取得了顯著進展。然而,LLMs 在理解和生成自然信號(例如圖像,視頻)等,還處在比較早期的探索階段。為了深入探討這一主題,我們在 AICon 全球人工智能開發(fā)與應(yīng)用大會上邀請到字節(jié)跳動研究科學(xué)家、豆包大模型視覺基礎(chǔ)研究團隊負(fù)責(zé)人馮佳時做主題演講《大語言模型在計算機視覺領(lǐng)域的應(yīng)用》。本次演講將介紹字節(jié)跳動視覺基礎(chǔ)研究團隊在這個方向的探索與進展,包括 LLMs 在圖像理解與視頻生成上的階段性結(jié)果。
我們將在 10 月 18 -19 日 QCon 上海站【AI 應(yīng)用開發(fā)實踐】專場,邀請各行業(yè)的優(yōu)秀 AI 應(yīng)用團隊,分享在實際產(chǎn)品中成功應(yīng)用計算機視覺、自然語言處理、個性化推薦、對話式交互等 AI 能力提升業(yè)務(wù)效率、優(yōu)化用戶體驗的案例與最佳實踐,共同探討 AI 應(yīng)用的未來發(fā)展方向。欲了解更多內(nèi)容,可訪問大會官網(wǎng):https://qcon.infoq.cn/2024/shanghai/track/1721
以下為演講實錄(經(jīng) InfoQ 進行不改變原意的編輯整理
原文鏈接:字節(jié)跳動馮佳時:大語言模型在計算機視覺領(lǐng)域的應(yīng)用、問題和我們的解法
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介: