被高估的Pika,被低估的多模態(tài)AI|甲子光年
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:被高估的Pika,被低估的多模態(tài)AI|甲子光年
關(guān)鍵字:視頻,模型,元宇宙,字節(jié)跳動(dòng),領(lǐng)域
文章來源:甲子光年
內(nèi)容字?jǐn)?shù):10199字
內(nèi)容摘要:如何打通物理世界和數(shù)字世界之間的屏障?作者|蘇霍伊編輯|王博??多模態(tài) AI 正處于爆發(fā)前夜。從 GPT-4V 的“驚艷亮相”,到 AI 視頻生成工具 Pika 1.0 的“火爆出圈”,再到谷歌 Gemini 的“全面領(lǐng)先”,多模態(tài) AI 都是其中的關(guān)鍵詞。盡管 Pika 1.0 的宣傳視頻被一些用戶認(rèn)為是“炒作”,亦或谷歌承認(rèn) Gemini 的演示視頻“經(jīng)過剪輯”,但不能否認(rèn),它們豐富了人們對(duì)多模態(tài) AI 的想象力?!爸昂芏喙径荚诰砦谋敬竽P?,GPT-4V 的出現(xiàn)代表多模態(tài)大模型可落地,毫無疑問明年大家都會(huì)卷多模態(tài)AI,原因很簡(jiǎn)單,因?yàn)?OpenAI 說明這條路是能夠走得通?!蔽⒉┬录夹g(shù)研發(fā)負(fù)責(zé)人、AI 首席科學(xué)家張俊林說。在行業(yè)主語為“落地”的當(dāng)下,多模態(tài) AI 正走向場(chǎng)景化、實(shí)用化、商業(yè)化。例如,在醫(yī)療領(lǐng)域可以通過結(jié)合圖像、錄音和病歷文本,提供更準(zhǔn)確的診斷和治療方案;在交通領(lǐng)域,…
原文鏈接:點(diǎn)此閱讀原文:被高估的Pika,被低估的多模態(tài)AI|甲子光年
聯(lián)系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡(jiǎn)介:甲子光年是一家科技智庫,包含智庫、社群、企業(yè)服務(wù)版塊,立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例,推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。