用大模型吃瓜更智能了！阿里通義實(shí)驗(yàn)室提出新時(shí)間線總結(jié)框架，全面提升新聞總結(jié)效率

開放域和封閉域TLS都更高效了

原標(biāo)題：用大模型吃瓜更智能了！阿里通義實(shí)驗(yàn)室提出新時(shí)間線總結(jié)框架，全面提升新聞總結(jié)效率
文章來源：量子位
內(nèi)容字?jǐn)?shù)：8181字

阿里巴巴和上海交大提出CHRONOS框架：AI幫你梳理新聞時(shí)間線

阿里巴巴通義實(shí)驗(yàn)室與上海交通大學(xué)的研究人員提出了一種基于Agent的新聞時(shí)間線摘要新框架——CHRONOS，旨在幫助用戶更方便地梳理復(fù)雜新聞的時(shí)間線。該框架模擬人類信息檢索過程，通過迭代多輪自我提問，結(jié)合檢索增強(qiáng)生成技術(shù)，從互聯(lián)網(wǎng)上檢索相關(guān)信息，生成時(shí)間順序的新聞?wù)?/p>

1. 開放域時(shí)間線總結(jié)的挑戰(zhàn)

時(shí)間線總結(jié)（TLS）任務(wù)旨在從大量文本中提取關(guān)鍵并按時(shí)間順序排列。開放域TLS（從互聯(lián)網(wǎng)檢索信息）比封閉域TLS（從預(yù)定義文章中提取）更具挑戰(zhàn)性，因?yàn)樗枰獜?qiáng)大的信息檢索和篩選能力，以及在沒有全局視圖的情況下識(shí)別和建立之間聯(lián)系的能力。

2. CHRONOS框架：迭代檢索，精準(zhǔn)總結(jié)

CHRONOS框架通過迭代提問進(jìn)行相關(guān)檢索，生成準(zhǔn)確、全面的時(shí)間線摘要，有效解決了開放域和封閉域TLS任務(wù)。其核心模塊包括：

自我提問 (Self-Questioning)：初始階段使用目標(biāo)新聞標(biāo)題進(jìn)行搜索，收集初步信息，然后迭代提問，檢索更多相關(guān)新聞。
問題改寫 (Question Rewriting)：將復(fù)雜問題分解為更具體、更易檢索的子問題，提高搜索效率。
時(shí)間線生成 (Timeline Generation)：合并每一輪檢索生成的時(shí)間線，總結(jié)重要。

為了優(yōu)化提問過程，CHRONOS引入了“時(shí)序信息量”（CI）的概念，衡量模型提出的問題檢索與參考時(shí)間線對(duì)齊的能力，從而選擇更有價(jià)值的問題進(jìn)行迭代。

3. 全新數(shù)據(jù)集Open-TLS

研究團(tuán)隊(duì)構(gòu)建了一個(gè)名為Open-TLS的新數(shù)據(jù)集，包含由專業(yè)記者撰寫的關(guān)于近期新聞的時(shí)間線，涵蓋、經(jīng)濟(jì)、社會(huì)、體育和科學(xué)技術(shù)等多個(gè)領(lǐng)域，為開放域TLS任務(wù)提供更全面的基準(zhǔn)。

4. 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B進(jìn)行，結(jié)果顯示CHRONOS在開放域和封閉域TLS任務(wù)中均優(yōu)于基線方法，在一些指標(biāo)上達(dá)到SOTA效果。尤其在開放域，CHRONOS顯著提高了總結(jié)質(zhì)量和日期對(duì)齊準(zhǔn)確性。在效率方面，CHRONOS也優(yōu)于需要處理所有文章的基線方法。

5. 案例研究：蘋果產(chǎn)品發(fā)布時(shí)間線

通過蘋果產(chǎn)品發(fā)布時(shí)間線的案例研究，展示了CHRONOS準(zhǔn)確提取關(guān)鍵和日期的能力，并指出了一些需要改進(jìn)的地方，例如對(duì)某些的遺漏或日期幻覺。

6. 結(jié)論

CHRONOS框架通過結(jié)合大型語言模型的迭代自我提問和檢索增強(qiáng)生成技術(shù)，為時(shí)間線總結(jié)任務(wù)提供了一種新穎有效的解決方案。其模擬人類信息檢索過程，通過不斷提問和回答來深入理解，最終生成全面且連貫的時(shí)間線摘要。未來研究方向包括探索該迭代提問的檢索生成方法在通用任務(wù)上的泛化能力。

聯(lián)系作者

文章來源：量子位
作者微信：
作者簡介：追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

閱讀原文

# AIGC動(dòng)態(tài)# AI輔助新聞報(bào)道 # 大模型新聞總結(jié)# 新聞?wù)侍嵘?/a># 時(shí)間線總結(jié)框架 # 阿里通義實(shí)驗(yàn)室

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

暫無評(píng)論

暫無評(píng)論...

用大模型吃瓜更智能了！阿里通義實(shí)驗(yàn)室提出新時(shí)間線總結(jié)框架，全面提升新聞總結(jié)效率

開放域和封閉域TLS都更高效了

阿里巴巴和上海交大提出CHRONOS框架：AI幫你梳理新聞時(shí)間線

1. 開放域時(shí)間線總結(jié)的挑戰(zhàn)

2. CHRONOS框架：迭代檢索，精準(zhǔn)總結(jié)

3. 全新數(shù)據(jù)集Open-TLS

4. 實(shí)驗(yàn)結(jié)果與分析

5. 案例研究：蘋果產(chǎn)品發(fā)布時(shí)間線

6. 結(jié)論

聯(lián)系作者

Sam Altman六字預(yù)言：AI奇點(diǎn)將近，是機(jī)遇還是危機(jī)？

RTX5090震撼發(fā)布，國行16499元起，黃仁勛「美國隊(duì)長」pose亮翻全場

相關(guān)文章

暫無評(píng)論

ChatGPT

畢業(yè)論文生成器

AIGC熱點(diǎn)