Deepmind Sparrow AI官網
Sparrow是一款信息查詢對話代理,通過強化學習和人類反饋訓練模型,提供更加有幫助、正確和無害的對話服務。它通過分解對話要求為自然語言規則,并提供支持事實性聲明的來源證據,使得代理行為更加可靠和可信。
網站服務:客戶支持,對話代理,強化學習,商業AI,客戶支持,對話代理,強化學習。
Deepmind Sparrow AI簡介
We present Sparrow, an information-seeking dialogue agent trained to be more helpful, correct, and harmless compared to prompted language model baselines. We use reinforcement learning from human feedback to train our models with two new additions to help human raters judge agent behaviour. First, to make our agent more helpful and harmless, we break down the requirements for good dialogue into natural language rules the agent should follow, and ask raters about each rule separately. We demonstrate that this breakdown enables us to collect more targeted human judgements of agent behaviour and allows for more efficient rule-conditional reward models. Second, our agent provides evidence from sources supporting factual claims when collecting preference judgements over model statements. For factual questions, evidence provided by Sparrow supports the sampled response 78% of the time. Sparrow is preferred more often than baselines while being more resilient to adversarial probing by humans, violating our rules only 8% of the time when probed. Finally, we conduct extensive analyses showing that though our model learns to follow our rules it can exhibit distributional biases.
什么是”Deepmind Sparrow AI”?
Sparrow是一款信息查詢對話代理,通過針對性的人類判斷來提高對話代理的對齊性。它通過強化學習和人類反饋來訓練模型,并采用兩種新方法來幫助人類評估代理行為。首先,為了使代理更加有幫助和無害,我們將良好對話的要求分解為代理應遵循的自然語言規則,并分別詢問評估者每個規則的情況。我們證明這種分解能夠讓我們收集到更有針對性的人類判斷代理行為的數據,并且可以構建更高效的基于規則條件的獎勵模型。其次,我們的代理在收集模型語句的偏好判斷時,提供支持事實性聲明的來源證據。對于事實性問題,Sparrow提供的證據在78%的情況下支持采樣的回答。當人類進行敵對探測時,Sparrow比基線更受歡迎,只有8%的時間違反我們的規則。最后,我們進行了廣泛的分析,表明盡管我們的模型學會了遵循我們的規則,但它可能存在分布偏差。
“Deepmind Sparrow AI”有哪些功能?
1. 提供信息查詢對話服務
2. 通過強化學習和人類反饋訓練模型
3. 分解對話要求為自然語言規則
4. 收集有針對性的人類判斷代理行為的數據
5. 構建基于規則條件的獎勵模型
6. 提供支持事實性聲明的來源證據
7. 具有更高的偏好度和抗敵對探測能力
產品特點:
1. 更加有幫助、正確和無害的對話代理
2. 支持自然語言規則的分解和評估
3. 提供支持事實性聲明的來源證據
4. 更高的偏好度和抗敵對探測能力
5. 學習遵循規則但可能存在分布偏差
應用場景:
1. 在信息查詢領域,用戶可以通過與Sparrow進行對話來獲取所需的信息。
2. 在對話代理研究中,Sparrow可以作為一個基準模型,用于評估其他對話代理的性能和對齊性。
“Deepmind Sparrow AI”如何使用?
用戶可以通過與Sparrow進行對話來獲取所需的信息。Sparrow會根據用戶的問題和需求提供相應的回答和支持。用戶可以直接與Sparrow進行交互,或者將Sparrow集成到自己的應用程序或網站中,提供更加智能和便捷的信息查詢服務。
Deepmind Sparrow AI官網入口網址
https://arxiv.org/abs/2209.14375
OpenI小編發現Deepmind Sparrow AI網站非常受用戶歡迎,請訪問Deepmind Sparrow AI網址入口試用。
數據統計
數據評估
本站OpenI提供的Deepmind Sparrow AI都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 4月 18日 上午4:53收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。