類比左右腦之非監督式學習架構 Split-Brain Autoencoders: Unsupervised Learning by Cross-Channel Prediction

Berkeley AI/CV Lab最近一篇入選CVPR 2017的論文,提出了一個新的Unsupervised Learning架構,學習到的特徵取得了state-of-the-art的結果。作者Richard Zhang在之前的Unsupervised Colorization的研究中(幫黑白的圖片上色),將圖片的L channel與AB channel分開,用L channel的特徵去預測AB channel[註],實驗證明確實可以從黑白照片的特徵中預測出適合的顏色。這篇研究上,巧妙的加上了另一條分支,反用AB channel的特徵去預測L channel,兩條監督式學習的分支預測出來的結果正好可以再組成完成的LAB Image。這樣的架構恰好就是一個標準的Autoencoder,在分支預測中學習到的兩組特徵,可以作為圖片的主要特徵使用,來做Transfer Learning在其他的目標上(Classification)。除了LAB Image之外,不同類型的Data都可以把其中的channel分成兩組,做類似的Unsupervised Feature Learning,像是上圖右中的RGB-D Image也可以拆成RGB以及HHA兩組Channel來做有效的特徵學習。
上圖顯示出,利用Split-Brain Autoencoders學習到的特徵,在ImageNet(左圖)的Image Classification,以及Places(右圖)的Scene Classification上,都能取得相較於其他Unsupervised Learning架構更好的分類結果。有興趣深入研究細節,可以參考論文以及作者公布使用Caffe做Training的Source Code:

註:指的是LAB Color Space,一種顏色表現的方法,細節請參考wiki 

Share the joy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

近期文章

近期迴響

彙整

分類

其它

Chien-Yi Wang Written by:

Be First to Comment

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *