原標題:一句話,滿足兩個廣告商!谷歌最新「Token拍賣模型」,多LLM聯合創作廣告詞
文章來源:新智元
內容字數:5771字
谷歌提出LLM Token拍賣模型:實現AI智能體高效協作
本文總結了谷歌研究人員提出的創新型token拍賣模型,該模型旨在解決多個大型語言模型(LLM)協同創作內容時如何協調“話語權”的問題,最終實現最佳效果。該模型尤其適用于廣告、內容創作等需要多個AI智能體合作的領域。
1. 問題背景:多LLM協作的挑戰
當多個LLM共同創作內容時,例如在廣告投放中,不同廣告商希望突出自身產品,這會導致協調困難。如何讓AI智能體在競爭與合作中找到平衡,生成既滿足各方利益又達到最佳效果的輸出,是一個關鍵問題。
2. Token拍賣模型:核心機制
谷歌提出的token拍賣模型,通過“競拍”的方式解決上述問題。該模型以token為單位,逐個進行拍賣。每個LLM作為競拍者,根據自身能力和意愿對下一個token進行出價。模型的核心包括兩個關鍵任務:
- 擴展共享的token序列:決定下一個添加到文本中的token。
- 確定每個競拍者的支付費用:通過支付函數計算每個LLM需要支付的費用。
分布聚合函數扮演“裁判”角色,綜合考慮每個LLM提供的token分布和出價,生成新的聚合分布;支付函數則確定每個智能體的支付金額,激勵其真實表達偏好。
3. 模型設計與關鍵屬性
研究人員強調了兩個理想屬性:支付單調性(提高出價,偏好體現更好)和一致聚合(不同LLM分布合理聚合)。他們證明這兩個屬性等同于分布聚合函數的單調性,這簡化了模型設計和分析。
研究人員借鑒了“第二價格”支付機制,即出價最高者獲得token,但支付第二高的價格,這能激勵智能體真實出價,避免盲目抬高價格。
4. 最優聚合策略與實驗結果
為了設計最優的分布聚合函數,研究人員構建了聚合損失函數,并提出了兩種有效的分布聚合函數:線性分布聚合函數和對數線性分布聚合函數。實驗結果表明,隨著出價權重的變化,生成的廣告內容能夠合理地體現各方利益訴求,實現了不同廣告商之間的有效協作。
5. 應用前景與結論
Token拍賣模型在廣告、內容創作、智能客服等領域具有廣闊的應用前景。它能讓不同品牌的廣告更巧妙地融合,提高廣告效果;也能讓多個智能體共同創作出更豐富、多元的內容。該模型為多個LLM的協同工作提供了新的思路,為后續研究和應用奠定了基礎。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。