NVIDIA提出最新影像操作合成技術Vid2Vid

先前NVIDIA Research在CVPR 2018提出了pix2pixHD的方法,將Image to image translation的畫質提升到了另一個境界之後,其原班人馬最近又上傳了一篇效果令人驚豔的論文vid2vid:利用已有的影片語意分割(video semantic maps) 當做輸入,去操作產生維持原本語意(semantic)的新影片。效果上不但維持了原本的high resolution結果,也在每一個video frame之間,保持了很好的temporal smoothness。在結果的轉換影片中可以看到,NVIDIA為了在道路上生成更多的街景資料下了許多功夫,藉由調整instance level的generator,可以生成許多種不同的街景style,除了建築的部分有一些明顯可見的artifact之外,其餘物體間的轉換與流暢度的效果真的很好。有興趣瞭解更多細節的讀者可以參考以下資源:
Project: https://tcwang0509.github.io/vid2vid/
Code: https://github.com/NVIDIA/vid2vid
Tutorial Video: https://www.youtube.com/watch?v=S1OwOd-war8

Share the joy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

近期文章

近期迴響

彙整

分類

其它

Chien-Yi Wang Written by:

Be First to Comment

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *