AIGC動態歡迎閱讀
原標題:超越OpenAI,谷歌重磅發布從大模型蒸餾的編碼器Gecko
關鍵字:模型,任務,數據,段落,文本
文章來源:夕小瑤科技說
內容字數:6157字
內容摘要:
夕小瑤科技說 原創作者 | Tscom
引言:介紹文本嵌入模型的重要性和挑戰文本嵌入模型在自然語言處理(NLP)領域扮演著至關重要的角色。它們將文本轉換為密集的向量表示,使得語義相似的文本在嵌入空間中彼此靠近。這些嵌入被廣泛應用于各種下游任務,包括文檔檢索、句子相似度、分類和聚類。然而,創建一個既通用又高效的文本嵌入模型面臨著巨大挑戰。這些模型需要大量的訓練數據來全面覆蓋所需的領域和技能,而且,手動標注數據的過程既耗時又昂貴,通常還會帶來不希望的偏見和缺乏多樣性。近年來,大語言模型(LLMs)因其在各種領域的廣泛知識和卓越的少樣本學習能力而成為了一種強大的替代方案。
本文介紹了Gecko,一個高效且多功能的文本嵌入模型。如下圖,Gecko通過從LLMs中提取知識并將其蒸餾到檢索器中,從而實現了強大的檢索性能。我們的兩步蒸餾過程首先使用LLM生成多樣化的合成配對數據。接下來,我們通過檢索每個查詢的候選段落集,并使用相同的LLM重新標記正面和非常負面的段落,進一步提煉數據質量。Gecko模型在Massive Text Embedding Benchmark(MTEB)上的緊湊性表現出色,2
原文鏈接:超越OpenAI,谷歌重磅發布從大模型蒸餾的編碼器Gecko
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189