OneRec – 快手推出的端到端生成式推薦系統
OneRec 是快手推出的一款革新性的端到端生成式推薦系統,它采用編碼器-解碼器架構和稀疏混合專家(MoE)技術,實現高效的計算性能,并能生成上下文連貫的推薦結果。通過會話式生成方法和迭代偏好對齊,OneRec 致力于提升推薦質量,并在快手平臺上取得了顯著的實際效果。
### 什么是 OneRec?
OneRec 是快手公司研發的下一代端到端生成式推薦系統。 摒棄了傳統的級聯推薦模式,OneRec 采用先進的編碼器-解碼器架構, 結合稀疏 Mixture-of-Experts (MoE) 技術,在保證高效計算的同時,能夠生成更具連貫性的推薦結果。它通過會話式生成方法,并結合迭代偏好對齊模塊與直接偏好優化(DPO),旨在全面提升推薦的質量。
### OneRec 的核心功能是什么?
* **端到端生成式架構:** OneRec 采用編碼器-解碼器架構, 將推薦問題轉化為序列生成任務。 編碼器負責整合用戶的歷史行為序列, 解碼器則通過稀疏混合專家(MoE)架構逐步生成用戶可能感興趣的視頻,實現對用戶興趣的深度理解。
* **會話式生成方法:** 區別于逐點預測的傳統方式,OneRec 采用會話式生成方法,一次性生成整個推薦列表,從而更好地捕捉用戶當前的上下文信息。
* **顯著的實驗效果:** 在快手平臺的 A/B 測試中,OneRec 實現了1.6% 的觀看時長提升,顯著優于傳統推薦方法。
### OneRec 的技術亮點有哪些?
* **編碼器-解碼器架構:** OneRec 基于 Encoder-Decoder 架構,將推薦問題轉化為一個序列生成任務。編碼器將用戶的歷史行為序列壓縮成興趣向量,解碼器則利用稀疏混合專家(MoE)架構生成用戶可能感興趣的視頻,實現對用戶興趣的精準捕捉和連貫推薦。
* **多模態分詞方案:** OneRec 創新性地采用了協同感知的多模態分詞方案,融合了視頻的標題、標簽、語音轉文字、圖像識別等多維信息,轉化為分層的語義 ID,從而更精確地建模用戶興趣。
* **強化學習偏好對齊:** OneRec 引入了基于獎勵機制的偏好對齊方法,通過強化學習來增強模型的效果。模型利用偏好獎勵、格式獎勵和業務獎勵構建綜合獎勵系統,優化生成結果,從而更好地捕捉用戶的細粒度偏好,提升推薦的精準度。
* **卓越的性能優化:** OneRec 通過架構重構,顯著壓縮了關鍵算子的數量,并利用稀疏 MoE 架構擴展了模型容量,大大提高了計算效率。 此外,通過訓練和推理優化,實現了更高的模型浮點運算利用率(MFU),從而大幅提升了算力效率。
### OneRec 的應用場景有哪些?
* **短視頻推薦:** OneRec 在快手的短視頻推薦主場景中表現出色,承擔了約 25% 的請求(QPS)。 憑借其生成式架構和強化學習偏好對齊技術,OneRec 在用戶停留時長、點贊、關注、評論等交互指標上均取得了顯著提升。
* **本地生活服務:** OneRec 在快手的本地生活服務場景中也取得了顯著成效。 AB 測試結果顯示,其推動了交易總額(GMV)增長 21.01%,訂單量提升 17.89%,購買用戶數增長 18.58%,新客獲取效率提升了 23.02%。
* **直播內容匹配:** OneRec 被應用于直播內容匹配,通過動態生成推薦序列,能更好地匹配用戶的實時興趣,提升用戶在直播場景中的參與度和互動率。
* **廣告投放:** 在廣告投放領域,OneRec 的生成式架構能根據用戶的興趣和行為動態生成廣告推薦,提高廣告的精準度和轉化率。
### 常見問題解答
* **OneRec 與傳統推薦系統的區別是什么?** OneRec 采用端到端生成式架構,而傳統推薦系統通常是級聯架構。 OneRec 通過會話式生成方法,生成上下文連貫的推薦列表,更注重用戶當前的興趣。
* **OneRec 如何提升推薦質量?** OneRec 通過編碼器-解碼器架構、會話式生成方法、多模態分詞、強化學習偏好對齊等技術,全面提升推薦的準確性、相關性和用戶體驗。
* **OneRec 的未來發展方向是什么?** OneRec 將持續優化模型架構和算法,探索更高效的推薦策略,并拓展在更多應用場景中的應用,為用戶帶來更好的體驗。