Synced 深度研学社 每周干货,每周五为大家推荐机器学习的入门教程、技术分析、以及资源分享。不多不少,每周进步一点点~
【入门书籍】 Learning From Data
by Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin
简介:这本机器学习的入门书籍是基于CalTech的一门课程,全面介绍了基础的理论、算法和应用,主要包括的内容有学习问题的形式和实现的可行性、形式化分析模型复杂度和样本复杂度、线形模型的运用、非线性变换的处理、拟合理论等。相应的课程有线上网站,主要资源有18个时长约一小时的lecture,8个homework,附加一份final。
链接: http://work.caltech.edu/telecourse.html
【技术分析】Machine Reading with Background Knowledge
by Lorenzo Ferrone, Fabio Massimo Zanzotto
简介:两位作者来自University of Rome 「Tor Vergata」。这篇论文详细介绍了自然语言处理中的词的表示方法,主要包括符号表示和分布式表示,旨在探索表示方法间的联系以进一步理解如何在深度学习网络中灵活运用。 注意这篇论文是一篇很详细的综述,篇幅较长,共有25页。
Lorenzo Ferrone:http://art.uniroma2.it/ferrone/
Fabio Massimo Zanzotto:http://art.uniroma2.it/zanzotto/
【资源分享】Free data sets for Azure Machine Learning
简介:这份资料是微软总结的可用于Azure的免费样本数据集,附有详细的使用指导,其领域覆盖广阔,包括的数据集有Adult Census Income Binary Classification dataset, Airport Codes Dataset, Automobile price data, Bike Rental UCI dataset, Bill Gates RGB Image, Blood donation data, Breast cancer data, Breast Cancer Features, Breast Cancer Info, Energy Efficiency Regression data, Flight on-time performance等。