微软剑桥研究院153页最新GAN教程(附代码)
原标题:微软剑桥研究院153页最新GAN教程(附代码)
原标题:八月·机器学习热门开源项目(Aug.2018)
【导读】Sebastian Nowozin在机器学习夏季课程(MLSS 2018年9月)做了关于GAN的教学,153页PPT详尽的解释了GAN的发展脉络和最新进展,此外他所提供原版大小为286MB 的pptx中包含大量动画效果,对课程的理解很有帮助。
转自 Xiaowen专知
Sebastian Nowozin是微软剑桥研究院首席研究院,专注于无监督于表示学习。他在GAN领域做了大量的工作,同时也是著名的f-GAN的作者。
【导读】整理了一份8月热门机器学习开源项目,包含了Auto Keras,Glow,Videoto Video,机器翻译,舞蹈生成器,足球视频到3D,垃圾邮件过滤,语音识别,图像生成,人脸处理等主题。请查收~
在训练 GAN 方面似乎有两三个阵营:第一个当然就是GAN的发明Ian Goodfellow以及他所供职的OpenAI和谷歌的一帮研究人员;**第二个强大的阵营也就是以这篇教程作者Sebastian Nowozin 为代表的微软阵营**;第三就是其他了。
作者 | Mybrigde
此次教程主要有以下几个部分:
编译 | Xiaowen
概率模型
在过去的一个月里,我们对近250个机器学习开放源码项目进行了排名,选出了前10名。
GANs的几个示范应用
在此期间,我们将项目与新版本或主要版本进行了比较。Mybridge AI根据各种因素对项目进行排名,以衡量专业质量。
评价原则
- 这个版本中GitHub star的平均数量:919个stars
- “Watch”机器学习GitHub上的前10位开放源码,每月收到一次电子邮件。
- 主题:Auto Keras,Glow,Videoto Video,机器翻译,舞蹈生成器,足球视频到3D,垃圾邮件过滤,语音识别,图像生成,人脸处理。
GAN 模型
开源项目可能对程序员有用。希望你能找到一个有趣的项目来激励你。
- 差异性与f-GAN 家族
- 基于积分概率度量(IPM)的GAN: MMD
- 基于积分概率度量(IPM)的GAN: Wasserstein GANs
问题与如何修正:模式崩溃(modecollapse)与不稳定性(Instability)
Autokeras: An opensource software library for automated machine learning (AutoML) [2715 stars onGithub]. Courtesy of Haifeng Jin
隐式模型
链接:https://github.com/jhfjhfj1/autokeras
开放性研究问题
GAN网络是近两年深度学习领域的新秀,一时风头无两。从计算机视觉顶会盛会CVPR 2018接受的论文统计就可见一斑:根据Google Research的研究科学家Jordi Pont-Tuset做的一个统计,它通过查看这些论文的类型,看到了未来深度学习的发展趋势。结果,他发现生成对抗网络(GAN)强势出击,大有取代“深度学习”(Deep Learning)之势。
下面这张图展示了CVPR 2018的论文题目中,关键词GAN、Deep,以及LSTM的对比:
Glow: Code for“Glow: Generative Flow with Invertible 1x1 Convolutions” [1687stars onGithub]. Courtesy of OpenAI
链接:**1. **https://blog.openai.com/glow/
在普通的“深度学习”走下坡路的同时,GAN慢慢的成为新宠,统计显示有8%的论文标题中含有GAN(这一数据相比2017年增长了2倍多)。
2. https://github.com/openai/glow
此外用尽字母表的各种GAN的变体 X-GAN 的论文数量也是急剧增加:
- 后台回复“GANMLSS” 就可以获取最新PPT下载链接~
Vid2vid: Pytorchimplementation of our method for high-resolution (e.g. 2048x1024)photorealistic video-to-video translation. [2821stars on Github]. Courtesy ofNVIDIA AI
参考链接:
链接:https://github.com/NVIDIA/vid2vid
https://github.com/nowozin/mlss2018-madrid-gan
http://www.nowozin.net/sebastian/
附PPT全文:
UnsupervisedMT:Phrase-Based & Neural Unsupervised Machine Translation—Facebook Research [515stars on Github]. Courtesy of FacebookResearch
链接:https://github.com/facebookresearch/UnsupervisedMT
DanceNet: Dancegenerator using Autoencoder, LSTM and Mixture Density Network. (Keras) [301 stars on Github]. Courtesy of Jaison Saji
链接:https://github.com/jsn5/dancenet
Soccerontable:Upconverting YouTube soccer videos in 3D for viewing in AR/VR devices.Soccer OnYour Tabletop with OpenCV [253stars on Github]. Courtesy of KonstantinosRematas
链接:
https://github.com/krematas/soccerontable
Artificial-adversary:Tool to generate adversarial text examples and test machine learning modelsagainst them—Airbnb [160stars on Github]. Courtesy of AirbnbEng
链接:
https://github.com/airbnb/artificial-adversary
宝马娱乐在线,Stt-benchmark:Speech to text benchmark framework [300stars on Github]. Courtesy of Picovoice
链接:
https://github.com/Picovoice/stt-benchmark
Sg2im: Code for “Image Generation fromScene Graphs”. A scene graph is a structured representation of a visual scenewhere nodes represent objects in the scene and edges represent relationshipsbetween objects [672stars on Github]. Courtesy of Google Open Source
链接:https://github.com/google/sg2im
GANimation:Anatomically-aware Facial Animation from a Single Image [355 stars on Github].Courtesy of Albert Pumarola
链接:
https://github.com/albertpumarola/GANimation
原文链接:
https://medium.mybridge.co/machine-learning-open-source-of-the-month-v-aug-2018-ae85e7302ea5
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!
请关注专知公众号,获取人工智能的专业知识!返回搜狐,查看更多
责任编辑:
本文由宝马娱乐在线城发布于世界互联,转载请注明出处:微软剑桥研究院153页最新GAN教程(附代码)
关键词: