在之前的文章中,我们和大家分享了很多跟数据以及第四范式团队相关的,好玩儿有意思的内容,从这一期开始我们打算“务点正业”,陆续推出原创的行业干货与大家分享,并且在《范“视”》这个栏目中,会持续的贡献我们对行业的思考,欢迎捧场,当然也欢迎拍砖。
我们打算从机器学习云服务说起。
诚然,为了让企业更便捷的应用机器学习,业界开始探索 “喂数据,取答案”的轻松方式。这种方式,在使用上对门槛的要求并不高,让不会机器学习的用户和企业也能够轻松上手。
在这个背景下,微软和亚马逊先后在2014年和2015年推出了各自的基于云的机器学习服务:Microsoft Azure Machine Learing Studio,Amazon Machine Learing Service。
这两个平台有什么区别?
我们从数据源、数据处理、建模算法、模型评估等方面对Amazon Machine Learing Service以及Microsoft Azure Machine Learing Studio进行了具体的对比。
(需要说明的是所有的实验和对比都是很利用各平台提供的控制台或者界面来操作的,但有些功能只能通过调用API的形式来使用。)
Figure 1 AWS Machine Leaning 界面
Figure 2 Microsoft Azure Machine Learning 界面
从直观上来说,Aws更为功能简单朴素,通过引导式的方式进行建模,而Azure功能更丰富,交互体验更好,给用户更大的自由度,通过拖拽的方式进行图形化的建模过程。
接下来,我们从多个维度对两者进行比对:
- 数据源
- AWS支持更大的数据集
- MS AZURE支持更广泛的数据格式和数据类型
- 数据处理
- 建模过程
- 模型评估
对比了这么多,我们直接看看两个平台的建模效果如何。
来做一个简单数据集上的对比试验:
我们从UCI Machine Learning Repository中选择了 Bank Marketing Dataset 作为测试的例子,这个数据集中有45000+的样本数据,每个样本有17个属性,最后两个平台上产生的模型的结果如下:
可以从结果看出:
两个平台的模型结果都很优秀,虽然有一定的差别,但是考虑到数据和算法都没有经过特别的优化,可以认为两个平台的建模效果基本在一个水平线上,可能在更细微的场景和特定的数据集上会各有优势,不过各中特殊之处就让看官自己去探寻吧!
好了,最后来一个靠谱的总结:
- 两个平台都是在“Machine Learning For Everyone”的想法下推出的,目的是为了更多的用户和企业能快捷的享受到机器学习技术的收益,而不用太关注具体的技术细节。
- AWS ML在使用上会更为简洁,但同时也牺牲了一些优化空间和利用用户自身经验的部分。而Azure ML则功能更丰富,更富于变化,这就对用户提出了一定的要求。
- 但两个平台都结合各自在云平台上完善的上下游服务,把机器学习这样的工具从实验室中解放出来,变成一个看得见的,真正可能产生实际市场效用的数据分析技术,并以SaaS的模式开始进行商业化的尝试,这一点已经比传统的软件工具的方式更进一步了。
当然如何让这一技术真正的和具体的业务更加贴近,前面还有很长的路要走,现在也有越来越多的企业和团队加入到了这一行列中。
我们有理由相信“AI For Everyone”的那天会很快到来。