木刻思 DEEP LEARNING NEWSLETTER 201708-04

刊物緣起:

由於 Deep Learning 近期的發展,處於一個超展開的知識爆炸時期,每天隨處可見隨手可得的各種 Deep Learning 資源,

有給初學者的,給進階者的,來自業界的實做經驗分享,來自學界的研究前緣論文與理論 … 等等。

木刻思作為一間長期投入數學與尖端科技研究的顧問公司,也觀察到了我們自己內部的合作夥伴們,也都常常朝遇到類似的問題 …

(1) 東西太多,分不太出來哪些是真正有價值的?哪些是看看就好的?

哪些是經典值得一看再看?哪些是最先進的實做,可以先跟著做體驗一下先進的科技?發想著下一代先進的應用!

(2) 新領域誕生和壯大的速度太快 (如GAN系列),很多資源都在網上紅個一兩天,收藏了以後沒有良好的分類,自己也找不太到自己的收藏?

(3) 找不到在追同一個領域的同好,一起討論最近彼此關注與蒐藏的資源與文章?

為了幫木刻思的夥伴們解決這些日常常遇到的問題,我們決定邀請各方 Deep Learning 的業界高手們,提供他們平常實做與研究正在關注的主題與資源。

並邀請一些本來就在做 Deep Learning 相關研究的專業小編,協助整理這些高手們提供的資源與連結!

建立一個方便搜尋,有著仔細分類的專欄,並於每兩週發表一次 Newsletter。

讓平常沒時間一篇一篇追的朋友,可以一次看完兩週最新的發展與概況!

近期,我們也將推出相關的讀書會,課程,或是一些 Learning Hackathon,

讓大家也可以有更多的機會聚在一起彼此交流著正在玩的最新的東西!

詳情請關注我們的網站與我們的粉專

正如木刻思的網站標題 Learning By Hacking 寫著,

木刻思是一個一直致力於提供最前緣 Hacker 學習最先進的技術的公司與社群

歡迎大家的加入!也希望可以持續和大家一起成長!

Hilighted Research Paper

Learning Cross-modal Embeddings for Cooking Recipes and Food Images

MIT在CVPR2017提出的將看到的食物照片轉換成食譜的研究,內有project demo的網站供有興趣的人上傳他們食物照片來找食譜。

Leveraging Demonstrations for Deep Reinforcement Learning on Robotics Problems with Sparse Rewards

DeepMind最新的有關Robotics的研究。結合了DDPG和Demonstration在很稀疏的報酬下在達到了相當的效果。

Synthesizing OBAMA: Learning Lip Sync From Audio

來自華盛頓大學的圖學與影像實驗室發表在SIGGRAPH 2017上的paper提出了新的唇型同步的方法,讓合成的假歐巴馬發表了一段真的歐巴馬以前的演說。他們使用time-delayed RNN訓練唇型以及針對嘴巴附近和頭部搖擺動作進行修飾,使這支影片顯得極為逼真。

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

OpenAI最新Multi-Agent的研究,其特色是不需要一個可導函數來作為環境的Model,也不需要設計一個特殊的溝通管道,因此更加泛用,除了合作導向的任務,也同時適用於兼具合作與競爭的情境。

DenseNet: Densely Connected Convolutional Networks

今年CVPR Best Paper之一,比ResNet更有效利用Skip-Connection的網路架構,達到一樣的Classification Performance只需要ResNet一半的參數!

Video Highlight Prediction Using Audiecne Chat Reactions

作者在EMNLP2017提出利用在直播場域的影像和文字來學習出預測每場比賽精采片段的研究,並開源相關的資料給有興趣做相關研究的人。

Unsupervised Learning of Depth and Ego-motion from Video

來自Berkeley與Google Research合作的CVPR Oral Paper,探討如何透過一連串影片的無監督學習,讓機器學會從單張圖片預測深度 (Depth Estimation)與在場景中的自身姿態 (Pose/Ego-motion Estimation)。

Post & Article

Apple Machine Learning Blog

Apple有自己的機器學習部落格了!第一篇文章就是詳細介紹在CVPR 2017發表的論文(Best Paper之一),教你如何用GAN讓合成的圖像看起來更真實,得到更多的訓練數據。

The data that transformed AI research—and possibly the world

這是Dr. Li Fei-Fei在今年CVPR大會上總結ImageNet過去近十年來發展的演說,內容涵蓋ImageNet的起源以及其對整個AI研究領域的影響。

The AI Podcast

由Nvidia官方主導的一個廣播節目,定期為邀請學術或業界高手來座談。節目性質偏娛樂,但會有一些有趣的小故事。

Minibatch Metropolis-Hastings

BAIR最新的部落格文章,介紹一個將Metropolis-Hasting的data size的cost從O(N)降到O(1)的新方法

Mask-RCNN

由 FAIR 的四位大神合發的 Mask R-CNN, 利用了 single-model 在 COCO 的 3 種競賽贏過了 COCO 2016 的冠軍

Code & Project

Open AI Open source Mujoco-py

MuJoCo是一款在2009年起源於華盛頓大學的運動控制實驗室的物理模擬引擎,使用C++撰寫,無論是速度或精確度與其他模擬工具相較起來都略勝一籌,連Google DeepMind都是使用MoJoCoy來訓練AI。最近OpenAI open source了一個新版本的python library:MoJoCo-py,在功能跟性能上都有顯著的提升。

Open AI open source RL-Teacher

OpenAI最新開源的Reinforcement Learning套件,可以讓人適度參與環境來指導agent學習。

Dataset

Speech COCO

這是用TTS來把COCO datset加上語音標注的新資料,可以用來做更多模態的訓練。

Share the joy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

近期文章

近期迴響

彙整

分類

其它

kuanchen Written by:

Be First to Comment

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *