什么是少量學(xué)習(xí)？

沃卡惠
客戶問答
2022-10-13 10:35:08
124

少樣本學(xué)習(xí)是指使用非常少量的訓(xùn)練數(shù)據(jù)來開發(fā)人工智能模型的各種算法和技術(shù)。少樣本學(xué)習(xí)努力讓 AI 模型在接觸相對較少的訓(xùn)練實(shí)例后識別和分類新數(shù)據(jù)。Few-shot訓(xùn)練與訓(xùn)練機(jī)器學(xué)習(xí)模型的傳統(tǒng)方法形成對比，傳統(tǒng)方法通常使用大量訓(xùn)練數(shù)據(jù)。少鏡頭學(xué)習(xí)主要用于計(jì)算機(jī)視覺。

為了對小樣本學(xué)習(xí)有更好的直覺，讓我們更詳細(xì)地研究一下這個(gè)概念。我們將研究小樣本學(xué)習(xí)背后的動機(jī)和概念，探索一些不同類型的小樣本學(xué)習(xí)，并在高層次上介紹小樣本學(xué)習(xí)中使用的一些模型。最后，我們將研究一些小樣本學(xué)習(xí)的應(yīng)用。

什么是少量學(xué)習(xí)？

“Few-shot learning”描述了用最少的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型的實(shí)踐。通常，機(jī)器學(xué)習(xí)模型是在大量數(shù)據(jù)上訓(xùn)練的，越大越好。然而，由于幾個(gè)不同的原因，few-shot learning是一個(gè)重要的機(jī)器學(xué)習(xí)概念。

使用少樣本學(xué)習(xí)的一個(gè)原因是它可以顯著減少訓(xùn)練機(jī)器學(xué)習(xí)模型所需的數(shù)據(jù)量，從而減少標(biāo)記大型數(shù)據(jù)集所需的時(shí)間。同樣，在使用通用數(shù)據(jù)集創(chuàng)建不同樣本時(shí)，少樣本學(xué)習(xí)減少了為各種任務(wù)添加特定特征的需要。少樣本學(xué)習(xí)可以理想地使模型更健壯，并且能夠基于更少的數(shù)據(jù)識別對象，從而創(chuàng)建更通用的模型，而不是標(biāo)準(zhǔn)的高度專業(yè)化模型。

少樣本學(xué)習(xí)最常用于計(jì)算機(jī)視覺領(lǐng)域，因?yàn)橛?jì)算機(jī)視覺問題的性質(zhì)需要大量數(shù)據(jù)或靈活的模型。

子類別

短語“few-shot”學(xué)習(xí)實(shí)際上只是一種使用很少訓(xùn)練示例的學(xué)習(xí)。由于您只使用“少數(shù)”訓(xùn)練示例，因此有一些小樣本學(xué)習(xí)的子類別也涉及使用最少數(shù)據(jù)量的訓(xùn)練。“一次性”學(xué)習(xí)是另一種類型的模型訓(xùn)練，包括教模型在看到該對象的一張圖像后識別該對象。one-shot 學(xué)習(xí)和few-shot 學(xué)習(xí)中使用的一般策略是相同的。請注意，術(shù)語“few-shot”學(xué)習(xí)可能被用作一個(gè)總稱，用于描述使用非常少的數(shù)據(jù)訓(xùn)練模型的任何情況。

少樣本學(xué)習(xí)的方法

大多數(shù)小樣本學(xué)習(xí)方法可以歸為以下三類之一：數(shù)據(jù)級方法、參數(shù)級方法和基于度量的方法。

數(shù)據(jù)級方法

小樣本學(xué)習(xí)的數(shù)據(jù)級方法在概念上非常簡單。當(dāng)你沒有足夠的訓(xùn)練數(shù)據(jù)時(shí)，為了訓(xùn)練一個(gè)模型，你可以得到更多的訓(xùn)練數(shù)據(jù)。數(shù)據(jù)科學(xué)家可以使用多種技術(shù)來增加他們擁有的訓(xùn)練數(shù)據(jù)量。

類似的訓(xùn)練數(shù)據(jù)可以備份您正在訓(xùn)練分類器的確切目標(biāo)數(shù)據(jù)。例如，如果您正在訓(xùn)練分類器以識別特定種類的狗，但缺少許多您嘗試分類的特定物種的圖像，您可以包含許多狗的圖像，這將有助于分類器確定構(gòu)成狗的一般特征.

數(shù)據(jù)增強(qiáng)可以為分類器創(chuàng)建更多的訓(xùn)練數(shù)據(jù)。這通常涉及對現(xiàn)有訓(xùn)練數(shù)據(jù)應(yīng)用轉(zhuǎn)換，例如旋轉(zhuǎn)現(xiàn)有圖像，以便分類器從不同角度檢查圖像。GAN 還可用于根據(jù)他們從您擁有的少數(shù)真實(shí)訓(xùn)練數(shù)據(jù)示例中學(xué)到的知識生成新的訓(xùn)練示例。

參數(shù)級方法

元學(xué)習(xí)

少樣本學(xué)習(xí)的一種參數(shù)級方法涉及使用一種稱為“元學(xué)習(xí)”的技術(shù)。元學(xué)習(xí)涉及教模型如何學(xué)習(xí)哪些特征在機(jī)器學(xué)習(xí)任務(wù)中很重要。這可以通過創(chuàng)建一種方法來規(guī)范如何探索模型的參數(shù)空間來實(shí)現(xiàn)。

元學(xué)習(xí)使用兩種不同的模型：教師模型和學(xué)生模型。“教師”模式和“學(xué)生”模式。教師模型學(xué)習(xí)如何封裝參數(shù)空間，而學(xué)生算法學(xué)習(xí)如何識別和分類數(shù)據(jù)集中的實(shí)際項(xiàng)目。換句話說，教師模型學(xué)習(xí)如何優(yōu)化模型，而學(xué)生模型學(xué)習(xí)如何分類。教師模型的輸出用于訓(xùn)練學(xué)生模型，向?qū)W生模型展示如何協(xié)商因訓(xùn)練數(shù)據(jù)太少而導(dǎo)致的大參數(shù)空間。因此，元學(xué)習(xí)中的“元”。

少樣本學(xué)習(xí)模型的主要問題之一是它們很容易過度擬合訓(xùn)練數(shù)據(jù)，因?yàn)樗鼈兘?jīng)常具有高維空間。限制模型的參數(shù)空間解決了這個(gè)問題，雖然它可以通過應(yīng)用正則化技術(shù)和選擇適當(dāng)?shù)膿p失函數(shù)來完成，但使用教師算法可以顯著提高少數(shù)模型的性能。

小樣本學(xué)習(xí)分類器模型（學(xué)生模型）將努力基于其提供的少量訓(xùn)練數(shù)據(jù)進(jìn)行泛化，并且通過教師模型引導(dǎo)其通過高維參數(shù)空間，其準(zhǔn)確性可以提高。這種通用架構(gòu)被稱為“基于梯度的”元學(xué)習(xí)器。

訓(xùn)練基于梯度的元學(xué)習(xí)器的全過程如下：

創(chuàng)建基礎(chǔ)學(xué)習(xí)者（教師）模型

在支持集上訓(xùn)練基礎(chǔ)學(xué)習(xí)器模型

讓基礎(chǔ)學(xué)習(xí)器返回查詢集的預(yù)測

訓(xùn)練元學(xué)習(xí)者（學(xué)生）因分類錯(cuò)誤而產(chǎn)生的損失

元學(xué)習(xí)的變化

模型無關(guān)元學(xué)習(xí)是一種用于增強(qiáng)我們上面介紹的基本基于梯度的元學(xué)習(xí)技術(shù)的方法。

正如我們在上面提到的，基于梯度的元學(xué)習(xí)器使用教師模型獲得的先前經(jīng)驗(yàn)來微調(diào)自身并為少量訓(xùn)練數(shù)據(jù)提供更準(zhǔn)確的預(yù)測。然而，從隨機(jī)初始化的參數(shù)開始意味著模型仍然可能過度擬合數(shù)據(jù)。為了避免這種情況，通過限制教師模型/基礎(chǔ)模型的影響來創(chuàng)建“模型無關(guān)”元學(xué)習(xí)器。不是直接針對教師模型做出的預(yù)測的損失來訓(xùn)練學(xué)生模型，而是針對其自身預(yù)測的損失對學(xué)生模型進(jìn)行訓(xùn)練。

對于訓(xùn)練與模型無關(guān)的元學(xué)習(xí)器的每一集：

創(chuàng)建當(dāng)前元學(xué)習(xí)器模型的副本。

副本在基礎(chǔ)模型/教師模型的幫助下進(jìn)行訓(xùn)練。

副本返回訓(xùn)練數(shù)據(jù)的預(yù)測。

計(jì)算損失用于更新元學(xué)習(xí)器。

度量學(xué)習(xí)

設(shè)計(jì)少量學(xué)習(xí)模型的度量學(xué)習(xí)方法通??常涉及使用基本距離度量來比較數(shù)據(jù)集中的樣本。余弦距離等度量學(xué)習(xí)算法用于根據(jù)查詢樣本與支持樣本的相似性對它們進(jìn)行分類。對于圖像分類器，這意味著僅根據(jù)表面特征的相似性對圖像進(jìn)行分類。在選擇支持圖像集并將其轉(zhuǎn)換為嵌入向量后，對查詢集進(jìn)行相同操作，然后比較兩個(gè)向量的值，分類器選擇與向量化查詢集具有最接近值的類.

更先進(jìn)的基于度量的解決方案是“原型網(wǎng)絡(luò)”。原型網(wǎng)絡(luò)將數(shù)據(jù)點(diǎn)聚類在一起，將聚類模型與上述基于度量的分類相結(jié)合。與 K-means 聚類一樣，為支持和查詢集中的類計(jì)算聚類的質(zhì)心。然后應(yīng)用歐幾里德距離度量來確定查詢集和支持集的質(zhì)心之間的差異，將查詢集分配給更接近的支持集類。

大多數(shù)其他小樣本學(xué)習(xí)方法只是上述核心技術(shù)的變體。

小樣本學(xué)習(xí)的應(yīng)用

小樣本學(xué)習(xí)在數(shù)據(jù)科學(xué)的許多不同子領(lǐng)域都有應(yīng)用，例如計(jì)算機(jī)視覺、自然語言處理、機(jī)器人技術(shù)、醫(yī)療保健和信號處理。

計(jì)算機(jī)視覺空間中的小樣本學(xué)習(xí)應(yīng)用包括高效的字符識別、圖像分類、對象識別、對象跟蹤、運(yùn)動預(yù)測和動作定位。用于小樣本學(xué)習(xí)的自然語言處理應(yīng)用包括翻譯、句子完成、用戶意圖分類、情感分析和多標(biāo)簽文本分類。小樣本學(xué)習(xí)可用于機(jī)器人領(lǐng)域，幫助機(jī)器人通過幾次演示了解任務(wù)，讓機(jī)器人學(xué)習(xí)如何執(zhí)行動作、移動和導(dǎo)航周圍的世界。少數(shù)藥物發(fā)現(xiàn)是人工智能醫(yī)療保健的新興領(lǐng)域。最后，few-shot learning可應(yīng)用于聲學(xué)信號處理，即分析聲音數(shù)據(jù)的過程。

上一篇：沃卡惠物聯(lián)卡網(wǎng)絡(luò)卡怎么辦？

下一篇：什么是自動編碼器？