支付寶長(zhǎng)眼睛了!打造新一代視覺搜索,AI幫你探索萬(wàn)物
下一代AI視覺搜索,不止于“搜”。
原標(biāo)題:支付寶長(zhǎng)眼睛了!打造新一代視覺搜索,AI幫你探索萬(wàn)物
文章來(lái)源:智東西
內(nèi)容字?jǐn)?shù):7209字
支付寶“探一下”:下一代AI視覺搜索的探索
本文探討了支付寶新推出的AI應(yīng)用“探一下”,以及其代表的下一代AI視覺搜索趨勢(shì)。與傳統(tǒng)視覺搜索不同,“探一下”的核心在于“探索”,它不僅能識(shí)別物體,還能提供知識(shí)、靈感、文本等多方面信息,堪稱隨身“視覺百科全書”。
1. 視覺搜索賽道的現(xiàn)狀與挑戰(zhàn)
過(guò)去,視覺搜索主要作為文字搜索的補(bǔ)充,但近年來(lái)其重要性日益凸顯。Google Lens的成功佐證了視覺搜索的巨大潛力,其每月調(diào)用量已超200億次。然而,國(guó)內(nèi)視覺搜索產(chǎn)品大多局限于特定領(lǐng)域,缺乏對(duì)圖片深層信息的理解和分析能力,未能實(shí)現(xiàn)突破性發(fā)展。
2. 生成式AI重塑視覺搜索
生成式AI(GenAI)的興起為視覺搜索帶來(lái)了性的變化。它使得視覺搜索從單純的信息檢索工具,進(jìn)化為能夠理解用戶意圖、提供個(gè)性化內(nèi)容、激發(fā)創(chuàng)意靈感并連接服務(wù)生態(tài)的智能工具。Google Lens和蘋果新款iPhone的視覺智能功能也體現(xiàn)了這一趨勢(shì)。
3. “探一下”的技術(shù)優(yōu)勢(shì)與創(chuàng)新
“探一下”正是基于GenAI技術(shù),將多模態(tài)大模型、mRAG技術(shù)、基礎(chǔ)視覺算法和Agent能力相結(jié)合。它采用多模態(tài)大模型全圖理解和open-set多主體檢測(cè)技術(shù),實(shí)現(xiàn)快速、精準(zhǔn)的意圖識(shí)別,并能進(jìn)行更深入的分析和解讀。同時(shí),它還具備“探靈感”功能,能根據(jù)場(chǎng)景生成趣味性文本,并通過(guò)輕量化推理加速和Coarse-to-Fine機(jī)制提升響應(yīng)速度。為了保證準(zhǔn)確性和可靠性,“探一下”利用RAG技術(shù)進(jìn)行信息交叉驗(yàn)證,并注明信息來(lái)源。此外,它還嚴(yán)格遵守支付寶的金融級(jí)安全合規(guī)標(biāo)準(zhǔn)。
4. “探一下”的生態(tài)優(yōu)勢(shì)與未來(lái)發(fā)展
依托支付寶龐大的用戶基礎(chǔ)和商業(yè)生態(tài),“探一下”有望成為國(guó)內(nèi)現(xiàn)象級(jí)視覺搜索產(chǎn)品?!疤揭幌隆蔽磥?lái)將專注于GenAI優(yōu)勢(shì)領(lǐng)域,并可能接入小程序、智能體等,進(jìn)一步拓展應(yīng)用場(chǎng)景,例如與支付寶的AI管家服務(wù)(支小寶、螞小財(cái)、AI健康管家)以及“車生活”服務(wù)進(jìn)行整合。此外,“探一下”也將在旅游、戶外、親子等場(chǎng)景落地,并探索無(wú)障礙輔助等領(lǐng)域,服務(wù)更多人群。團(tuán)隊(duì)還在探索與智能硬件的融合,例如智能眼鏡等。
5. 總結(jié):視覺搜索的未來(lái)
在生成式AI時(shí)代,視覺搜索將成為搜索的重要組成部分,它不再僅僅是尋找答案,而是提供更智能、更豐富、更具交互性的服務(wù)體驗(yàn)。支付寶“探一下”的推出,標(biāo)志著螞蟻集團(tuán)在AI First戰(zhàn)略上的進(jìn)一步推進(jìn),也為下一代AI視覺搜索的發(fā)展方向提供了新的思路,有望讓AI技術(shù)更便捷地服務(wù)大眾生活。
聯(lián)系作者
文章來(lái)源:智東西
作者微信:
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。