提升生成式零樣本學習能力,視覺增強動態(tài)語義原型方法入選CVPR 2024
AIGC動態(tài)歡迎閱讀
原標題:提升生成式零樣本學習能力,視覺增強動態(tài)語義原型方法入選CVPR 2024
關(guān)鍵字:樣本,視覺,語義,特征,生成器
文章來源:機器之心
內(nèi)容字數(shù):6782字
內(nèi)容摘要:
機器之心專欄
機器之心編輯部雖然我從來沒見過你,但是我有可能「認識」你 —— 這是人們希望人工智能在「一眼初見」下達到的狀態(tài)。
為了達到這個目的,在傳統(tǒng)的圖像識別任務中,人們在帶有不同類別標簽的大量圖像樣本上訓練算法模型,讓模型獲得對這些圖像的識別能力。而在零樣本學習(ZSL)任務中,人們希望模型能夠舉一反三,識別在訓練階段沒有見過圖像樣本的類別。
生成式零樣本學習(GZSL)是實現(xiàn)零樣本學習的一種有效方法。在生成式零樣本學習中,首先需要訓練一個生成器來合成未見類的視覺特征,這個生成過程是以前面提到的屬性標簽等語義描述為條件驅(qū)動的。有了生成的視覺特征作為樣本,就可以像訓練傳統(tǒng)的分類器一樣,訓練出可以識別未見類的分類模型。
生成器的訓練是生成式零樣本學習算法的關(guān)鍵,理想狀態(tài)下,生成器根據(jù)語義描述生成的某個未見類的視覺特征樣本,應與此類別真實樣本的視覺特征具有相同的分布。
在現(xiàn)有的生成式零樣本學習方法中,生成器在被訓練和使用時,都是以高斯噪聲和類別整體的語義描述為條件的,這限制了生成器只能針對整個類別進行優(yōu)化,而不是描述每個樣本實例,所以難以準確反映真實樣本視覺特征的分布,導致模型的泛化性
原文鏈接:提升生成式零樣本學習能力,視覺增強動態(tài)語義原型方法入選CVPR 2024
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺