支付寶長眼睛了!打造新一代視覺搜索,AI幫你探索萬物
下一代AI視覺搜索,不止于“搜”。
原標題:支付寶長眼睛了!打造新一代視覺搜索,AI幫你探索萬物
文章來源:智東西
內容字數:7209字
支付寶“探一下”:下一代AI視覺搜索的探索
本文探討了支付寶新推出的AI應用“探一下”,以及其代表的下一代AI視覺搜索趨勢。與傳統(tǒng)視覺搜索不同,“探一下”的核心在于“探索”,它不僅能識別物體,還能提供知識、靈感、文本等多方面信息,堪稱隨身“視覺百科全書”。
1. 視覺搜索賽道的現狀與挑戰(zhàn)
過去,視覺搜索主要作為文字搜索的補充,但近年來其重要性日益凸顯。Google Lens的成功佐證了視覺搜索的巨大潛力,其每月調用量已超200億次。然而,國內視覺搜索產品大多局限于特定領域,缺乏對圖片深層信息的理解和分析能力,未能實現突破性發(fā)展。
2. 生成式AI重塑視覺搜索
生成式AI(GenAI)的興起為視覺搜索帶來了性的變化。它使得視覺搜索從單純的信息檢索工具,進化為能夠理解用戶意圖、提供個性化內容、激發(fā)創(chuàng)意靈感并連接服務生態(tài)的智能工具。Google Lens和蘋果新款iPhone的視覺智能功能也體現了這一趨勢。
3. “探一下”的技術優(yōu)勢與創(chuàng)新
“探一下”正是基于GenAI技術,將多模態(tài)大模型、mRAG技術、基礎視覺算法和Agent能力相結合。它采用多模態(tài)大模型全圖理解和open-set多主體檢測技術,實現快速、精準的意圖識別,并能進行更深入的分析和解讀。同時,它還具備“探靈感”功能,能根據場景生成趣味性文本,并通過輕量化推理加速和Coarse-to-Fine機制提升響應速度。為了保證準確性和可靠性,“探一下”利用RAG技術進行信息交叉驗證,并注明信息來源。此外,它還嚴格遵守支付寶的金融級安全合規(guī)標準。
4. “探一下”的生態(tài)優(yōu)勢與未來發(fā)展
依托支付寶龐大的用戶基礎和商業(yè)生態(tài),“探一下”有望成為國內現象級視覺搜索產品。“探一下”未來將專注于GenAI優(yōu)勢領域,并可能接入小程序、智能體等,進一步拓展應用場景,例如與支付寶的AI管家服務(支小寶、螞小財、AI健康管家)以及“車生活”服務進行整合。此外,“探一下”也將在旅游、戶外、親子等場景落地,并探索無障礙輔助等領域,服務更多人群。團隊還在探索與智能硬件的融合,例如智能眼鏡等。
5. 總結:視覺搜索的未來
在生成式AI時代,視覺搜索將成為搜索的重要組成部分,它不再僅僅是尋找答案,而是提供更智能、更豐富、更具交互性的服務體驗。支付寶“探一下”的推出,標志著螞蟻集團在AI First戰(zhàn)略上的進一步推進,也為下一代AI視覺搜索的發(fā)展方向提供了新的思路,有望讓AI技術更便捷地服務大眾生活。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業(yè)新媒體!智東西專注報道人工智能主導的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產業(yè)升級。聚焦智能變革,服務產業(yè)升級。