提升生成式零樣本學習能力，視覺增強動態(tài)語義原型方法入選CVPR 2024

AIGC動態(tài)1年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標題：提升生成式零樣本學習能力，視覺增強動態(tài)語義原型方法入選CVPR 2024
關(guān)鍵字：樣本,視覺,語義,特征,生成器
文章來源：機器之心
內(nèi)容字數(shù)：6782字

內(nèi)容摘要：

機器之心專欄
機器之心編輯部雖然我從來沒見過你，但是我有可能「認識」你 —— 這是人們希望人工智能在「一眼初見」下達到的狀態(tài)。
為了達到這個目的，在傳統(tǒng)的圖像識別任務中，人們在帶有不同類別標簽的大量圖像樣本上訓練算法模型，讓模型獲得對這些圖像的識別能力。而在零樣本學習（ZSL）任務中，人們希望模型能夠舉一反三，識別在訓練階段沒有見過圖像樣本的類別。
生成式零樣本學習（GZSL）是實現(xiàn)零樣本學習的一種有效方法。在生成式零樣本學習中，首先需要訓練一個生成器來合成未見類的視覺特征，這個生成過程是以前面提到的屬性標簽等語義描述為條件驅(qū)動的。有了生成的視覺特征作為樣本，就可以像訓練傳統(tǒng)的分類器一樣，訓練出可以識別未見類的分類模型。
生成器的訓練是生成式零樣本學習算法的關(guān)鍵，理想狀態(tài)下，生成器根據(jù)語義描述生成的某個未見類的視覺特征樣本，應與此類別真實樣本的視覺特征具有相同的分布。
在現(xiàn)有的生成式零樣本學習方法中，生成器在被訓練和使用時，都是以高斯噪聲和類別整體的語義描述為條件的，這限制了生成器只能針對整個類別進行優(yōu)化，而不是描述每個樣本實例，所以難以準確反映真實樣本視覺特征的分布，導致模型的泛化性

原文鏈接：提升生成式零樣本學習能力，視覺增強動態(tài)語義原型方法入選CVPR 2024