Synced 深度研学社 每周干货,每周五为大家推荐机器学习的入门教程、技术分析、以及资源分享。不多不少,每周进步一点点~
【入门资料】Machine Learning is Fun!
by Adam Geitgey
简介:
这是一份发布于Medium上的号称世界上最简单的机器学习教程。这篇教程简单直白,概括多于细节,作者称旨在让更多零基础却对机器学习感兴趣的人有对此领域的通识。作者首先介绍监督式和非监督式学习,再介绍一个估计房价的例子,并通过这个例子展开讲了一些算法细节的直观解释。全文共8个部分,有多种语言的译文。
链接:https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471
【技术分析】Training RNNs as Fast as CNNs
by Tao Lei, Yu Zhang
简介:
这篇论文提出一个新的RNN 实现,旨在简化并行状态计算,展现更多的并行,提高RNN的缩放性。作者得出这个新的循环单元速度同卷基层相似,并且比cuDNN优化过的LSTM要快。作者也实验证明了此循环单元在诸多应用问题上有提升效果,比如分类、问答、语言建模、翻译等。作者同时提供了PyTorch和CNTK的实现。
链接:https://arxiv.org/pdf/1709.02755.pdf
【资源分享】NewsQA: A Machine Comprehension Dataset
by Adam Trischler, Tong Wang, Xingdi Yuan, Justin Harris, Alessandro Sordoni, Philip Bachman, Kaheer Suleman
简介:
这是Maluuba Research研究员发布的供于机器阅读理解的数据集,包括十万多个人工标注的问答组合,侧重于通过推理得到答案的问题。问答资源来自于CNN的新闻文章,答案包括对应文章及文本片段。随之发布的论文中包含了对主流数据集的介绍和优缺点分析,结论到NewsQA覆盖的文章和问题更广泛,且要求相对更复杂的推理。
论文链接:https://arxiv.org/pdf/1611.09830.pdf