说起AutoML,谷歌显然是一个绕不开的话题。虽然AutoML并不是谷歌创造的单词,但它的确是因为谷歌而进入大众视野。
2017年在谷歌开发者大会上,Sundar Pichai(谷歌CEO)首次公布了AutoML项目,他在博客中这样写道,“Today, designing neural nets is extremely time intensive, and requires an expertise that limits its use to a smaller community of scientists and engineers. That’s why we’ve created an approach called AutoML, showing that it’s possible for neural nets to design neural nets.”
如果我们要给这段话划个重点,那就是神经网络,神经网络,还是神经网络。
紧接着在2018年1月,李飞飞(曾任谷歌首席人工智能科学家)在Twitter上发布了谷歌云AutoML Vision,这次发布迅速引起了全世界范围内的大量关注,甚至被业内人士认为是一直面向ML和AI开发者提供服务的谷歌云的战略转型。其产品背后依赖的是两种核心技术,一种是迁移学习,另外一种则是神经架构搜索。
不用担心,即使你对神经网络、迁移学习、神经架构搜索这些单词一点也不了解也没有关系,它们的背后其实都是同一件事情,那就是深度学习,这恰恰也是谷歌最擅长的事情。再加上由于谷歌对AutoML的大量宣传,大众很自然地在潜意识中将AutoML与深度学习捆绑在一起。
虽然深度学习在图像识别(这也是AutoML Vision最初面向的对象)领域有着更突出的表现是事实,但是我们也在之前的博客中说过,深度学习并不是万能的解药,AutoML作为一种自动化的方法更不是只为深度学习服务的。
谷歌提供的ML“神奇配方”也不只是AutoML,还有更强大的运算能力。Jeff Dean在2018年3月举办的TensorFlow Dev Summit大会上宣称,未来谷歌可能会用100倍的运算能力取代机器学习专家。
这一声明显然引发了很多讨论,有博客做出了这样的评价,“在评估谷歌的声明时,应当牢记,如果我们被说服,相信有效使用深度学习技术的关键是提高计算能力,谷歌将从中利益,因为在这一领域,谷歌明显遥遥领先。如果这是真的话,我们可能都需要购买谷歌的产品。就其本身而言,这并不意味着谷歌的说法都是错误的,但很好地了解他们的声明背后隐藏的经济动机是有必要的。”(链接:https://www.fast.ai/2018/07/23/auto-ml-3/)
所以,当我们审视AutoML这项技术的时候,就有必要全面看待所有的信息,重新作出理性的判断。
为什么会出现AutoML这种技术?
在典型的机器学习应用程序中,机器学习专家必须应用适当的数据预处理,特征工程,特征提取和特征选择方法,执行算法选择和超参数优化,来最大化机器学习模型的预测性能。由于其中许多步骤通常都需要大量的专业知识,所以只有专业人士才能完成。但为了让更多的普通用户可以使用机器学习,同时也为了帮助机器学习从业者简化流程,提升工作效率,AutoML就出现了,而且成为了眼下应对这一挑战的最佳解决方案。
AutoML旨在创建让用户可以”开箱即用“的软件,帮助缺乏机器学习专业知识的用户完成机器学习流程中,包括数据预处理,特征提取和选择,模型选择,超参数优化,模型验证等步骤,用户甚至只需要在电脑上使用一些拖拽之类的操作就能够实现自己想要的功能。
“就好像 C 语言的发明,让程序设计者从此不用懂太多底层电脑的架构就可以写程序。”
---LIVEhouse共同创办人程世嘉
AutoML的优势有哪些?
显然,AutoML最大的优势就是让更多的人可以使用机器学习来解决问题(也就是近些年被提及很多的“AI民主化”),不过我们还是希望将其他所有的优势也都分享出来,在综合了不同渠道和不同专家的分析之后,我们得出了以下几点:
1. 通过自动执行的重复性任务来提高工作效率。
2. 自动化机器学习有助于避免可能因手动引入的错误。
3. 自动化机器学习能够帮助机器学习应用拥有更好的一致性和可规模化能力。
4. 将机器学习流程自动化让快速迭代开发成为可能。
5. 可以缓解不断增长的对数据科学家,机器学习工程师,和机器学习应用的需求。
6. 有了AutoML,许多想要使用机器学习但又不愿意花费重金或者大量的时间成本的公司就可以做出自己的尝试了。
7. 对于企业来说,即便是最贵的机器学习专利解决方案,也比咨询费用或者给机器学习专家的全职工资要更容易负担。
目前有哪些AutoML产品?
谷歌AutoML Vision在上面我们已经介绍过了,除此之外,谷歌还发布了针对视频图像,自然语言处理等领域的多款AutoML产品。
2017年底,微软也发布CustomVision.AI,涵盖图像、视频、文本和语音等各个领域,2018年1月,该公司又推出了完全自动化的平台 Microsoft Custom Vision Services。
国内的百度、阿里等巨头也都推出了自己的AutoML产品。当然还有很多像Qeexo这样的创业公司进入了这个充满潜力的领域。
但值得注意的是,大多数AutoML产品针对深度学习开发,多应用于图像、视频、声音识别,自然语言处理,文本识别,在很多更边缘化的问题上,并没有优势。例如,对于很多移动、物联网行业的企业来说,高度受限的环境和针对传感器数据的解决方案恰恰才是他们面临的问题以及所需要的答案。
所以,在某些特殊的领域,例如轻量化AutoML的领域,创业公司的产品可能才是更好的选择,例如Qeexo所开发的Qeexo AutoML。
(至于Qeexo AutoML到底能够帮助企业解决什么问题,我们会在之后的博客中再详细讨论。)
如今,无疑几乎所有企业都将目光投向了机器学习,但并不是所有企业都可以义无反顾地投入巨大成本来进行无法预知结果的尝试。但有了AutoML的帮助,就能让更多中小型公司获得试错的机会,同时,也会让机器学习有机会发挥出更大的作用。