顯著提升平臺收入等關鍵指標,有效逼近理論最優拍賣結果
阿里媽媽生成式拍賣:AI賦能在線廣告拍賣機制優化
本文介紹了阿里媽媽展示廣告機制策略團隊在生成式拍賣(AIGA)方向的研究成果,該研究已發表在KDD’25 Research Track。研究團隊提出了一種名為上下文生成式拍賣(CGA)的新型拍賣機制,旨在通過生成式模型優化在線廣告拍賣,提升平臺收入和廣告主收益。
1. 傳統拍賣機制的局限性
傳統的廣義二價拍賣(GSP)等機制依賴于點擊率分離假設,忽略了頁面中其他商品(外部性)的影響。基于深度學習的拍賣機制如DNA和SW-VCG雖然增強了對高維特征的編碼能力,但仍受限于“先預估后分配”的范式,無法捕捉最終分配結果的整頁上下文信息(排列外部性),難以達到全局最優。
2. 排列外部性和最優拍賣機制
文章指出,在排列外部性影響下,廣告主提高出價并不一定提高最終CTR,傳統的單調性假設不再成立。研究團隊通過理論分析,證明了即使考慮排列外部性,Myerson最優拍賣的基本形式仍然成立,即分配規則和計費規則可以解耦。
3. 生成式拍賣 (CGA) 的設計與實現
為了高效地解決最優分配問題,CGA采用生成器-評估器架構。生成器使用自回歸模型,逐坑位生成廣告序列,最大化期望虛擬福利;評估器校準精排階段的單點pCTR,結合序列上下文信息,為生成器提供獎勵信號;計費模塊通過優化事后后悔(ex-post regret)學習最優計費規則,保證激勵兼容性(IC)和個體理性(IR)。
4. CGA 的模型架構
CGA的生成器包括排列不變性的集合編碼器和排列同變性的自回歸解碼器。集合編碼器編碼廣告embedding序列,解碼器使用GRU單元建模廣告在坑位的條件概率。評估器使用雙向LSTM和self-attention模塊提取序列上下文信息,校準pCTR。計費模塊通過sigmoid激活函數輸出計費比。
5. 訓練流程與損失函數
CGA的訓練過程將分配求解模塊和計費模塊解耦。首先訓練評估器,最小化交叉熵損失;然后凍結評估器參數,訓練生成器,使用Policy Gradient方法最大化獎勵函數(包含Self-Reward和External-Reward);最后,使用增廣拉格朗日方法優化計費模塊,最小化事后后悔。
6. 實驗結果與結論
離線實驗和在線A/B實驗結果表明,CGA顯著提升了平臺收入(RPM)、CTR、GMV和廣告主ROI,同時有效逼近理論最優拍賣的結果。在線實驗中,CGA推理時延僅增加1.6%,RPM提升了3.2%。
7. 未來研究方向
未來的研究將探索更高效的生成式架構,以及在拍賣機制中統一分配來自多渠道的商品。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破