[經典系列] Value iteration Network

Berkeley團隊提出的Value Iteration Network在Deep Learning殿堂NIPS 2016拿下最佳論文獎,將Reinforcement Learning中的Value Iteration巧妙的類比作CNN的運算,而這種mode-based的方法讓Agent不只會識別障礙物,還能學會利用地圖資訊來做Planning。

[導讀] https://read01.com/dd7GM6.html

[Paper] https://arxiv.org/pdf/1602.02867.pdf

[Github] https://github.com/avivt/VIN

[Video] https://channel9.msdn.com/Events/Neural-Information-Processing-Systems-Conference/Neural-Information-Processing-Systems-Conference-NIPS-2016/Value-Iteration-Networks

Share the joy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

近期文章

近期迴響

彙整

分類

其它

leoyang Written by:

Be First to Comment

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *