微软研究院AI头条原创

2019/12/27 10:46

宋驰作者

上新了，NNI！微软开源自动机器学习工具NNI概览及新功能详解

2018年9月，微软亚洲研究院发布了第一版 NNI (Neural Network Intelligence) ，目前已在 GitHub 上获得 3.8K 星，成为最热门的自动机器学习（AutoML）开源项目之一。

作为为研究人员和算法工程师量身定制的自动机器学习工具和框架，NNI 在过去一年中不断迭代更新，我们发布了稳定 API 的 1.0 版本，并且不断将最前沿的算法加入其中，加强对各种分布式训练环境的支持。

最新版本的 NNI 对机器学习生命周期的各个环节做了更加全面的支持，包括特征工程、神经网络架构搜索（NAS）、超参调优和模型压缩在内的步骤，你都能使用自动机器学习算法来完成。

无论你是刚刚入门机器学习的小白，还是身经百战的“调参大法师”，NNI 都能助你一臂之力。在这篇文章中，我们会全方位解读 NNI 最新版本中的各项功能，让大家了解这个简单易用的自动机器学习工具。

概述

自动机器学习是近年来火热的应用和研究方向，各种自动机器学习工具也层出不穷，它们各有优点与局限性。有的聚焦于算法，但不支持分布式训练；有的功能强大，但没有易用的用户界面，学习成本较高；有的只支持特定领域，不提供通用功能；还有的只能在云端使用。

微软自动深度学习工具 NNI 具备以下优势：

• 支持多种框架：提供基于 Python 的 SDK，支持 PyTorch、TensorFlow、scikit-learn、LightGBM 等主流框架和库；

• 支持多种训练平台：除在本机直接运行外，还能通过 SSH 调度一组 GPU 服务器，或通过 FrameworkController、KubeFlow、OpenPAI 等在 Kubernetes 下调度大规模集群；

• 支持机器学习生命周期中的多环节：特征工程、神经网络架构搜索（NAS）、超参调优和模型压缩等；

• 提供易用的命令行工具和友好的 WEB 用户界面；

• 大量的示例能帮助你很快上手；

• 最后划重点，NNI的所有文档都有中文版！

完整中文文档请参考：https://aka.ms/nnizh

自动机器学习工具对比

NNI 入门与超参优化

机器学习和人工智能通过近些年的厚积薄发，已经形成不少经典的机器学习算法和深度学习网络，这些算法各有特点，在不同的数据集上所需要的超参也有所不同。而自动机器学习中的超参优化就是为了解决这个问题，通过启动多个实例来找到调优结果较好的组合。

NNI 的超参调优功能就是为这样的场景准备的。在超参搜索算法上，NNI 不仅提供了 TPE、SMAC、进化算法等优秀算法，还提供了遍历、批处理、随机、Hyperband 等十多种算法。另外，还支持自动终止低效实例，加速学习过程。

NNI 的安装基于 Python pip 命令，“pip install nni”即可一步完成。

NNI 的使用也非常简单：首先，定义好需要搜索的超参空间；然后，在需要调参的网络启动之前，通过 NNI 的接口读取参数并在训练中将精确度等指标传入 NNI；最后，配置好要使用的调参算法等，即可开始。

具体过程可参考入门教程：https://aka.ms/nnizq

你也可以在这里找到所有示例：https://aka.ms/nnize

一图了解 NNI 使用

NNI 的超参调优不仅能用于机器学习，对于各类系统、数据库的繁杂参数都可以根据实际场景进行有针对性的调优。使用过程和超参调优非常类似，通过 Python 为系统传入不同的参数配置，然后将确定的调优指标（如读写速度，磁盘空间大小等）回调给 NNI 即可。

更多信息请访问：https://aka.ms/nnizrd

NNI 在运行中，可随时通过界面了解进度

分析超参之间的关联关系，快速发现规律

自动特征工程

特征工程是应用经典机器学习算法的前置步骤，通过特征工程，能让机器学习过程更快得到较好的结果。

前面介绍的 NNI 的超参调优功能，可直接应用于特征增强、自动特征选择等特征工程中的各个子领域。为使新手轻松上手，NNI 还内置了基于梯度和决策树的自动特征选择算法，同时还提供了扩展其它算法的接口。

NNI 团队还对自动特征工程的效果进行了对比，在流行的 colon-cancer、gisette、rcv1、neews20.binary、real-sim 等数据集上进行了测试。我们发现如果在成千上万个特征中仅选择前20个，决策树基本都能取得较好的结果，如果选出更多特征，会得到更好的效果。

更多信息请访问：https://aka.ms/nnizfe

神经网络结构搜索（NAS）

神经网络搜索（Neural Architecture Search，简称 NAS）通过自动搜索网络结构来获得较好的性能，在今年涌现了大量研究成果。NAS 算法多种多样，实现也各不相同。

为了促进 NAS 的创新，我们对 NAS 算法抽象与实现进行了探索，让用户不仅能在自己的数据集上直接应用算法，还能很容易地横向比较不同 NAS 算法的效果。

NNI 中实现了 ENAS、DARTS、P-DARTS 算法，并提供了 one-shot 算法的接口。另外，还支持了网络模态（Network Morphism）这样的经典搜索方法。

算法介绍及用法：https://aka.ms/nnizn

模型压缩

随着深度学习的发展，模型也越来越大。虽然精确度有了很大的提升，但较大的模型尺寸不仅会影响推理速度，还对部署的硬件要求较高。因此，模型压缩也是一个热门话题。

主要的模型压缩算法可分为两类，一类是压缩网络结构的剪枝算法，另一类是减小模型精度的量化算法。NNI 目前提供了 AGP、L1Filter、Slim、Lottery Ticket、FPGM、QAT、DoReFa 等9种模型压缩算法。用户也可根据需要，通过 NNI 的模型压缩接口来实现自己的压缩算法。

相关算法介绍及用法：https://aka.ms/nnizc

结语

随着人工智能的发展，理论和建模方法也始终在不断演进。立足于研究与应用的最前线，我们希望将最好用的工具提供给每一位研究员和算法工程师，加速人工智能领域的发展进步。

2020年，我们将加速创新，力图让 NNI 能够提供全生命周期的自动化框架、更丰富的算法、更高效的分布式调参效率，进一步提升 NNI 的易用性和用户体验。

作为一个开源项目，我们期待大家为 NNI 添加新算法、功能、示例，也希望大家为 NNI 提出建议、报告问题，让我们为大家提供更好的工具，如果您有任何反馈与建议，欢迎在 GitHub 社区中告知我们。

NNI 的 GitHub 社区：https://aka.ms/nniis

微软研究院AI头条

专注科研19年，盛产黑科技

产业微软机器学习

相关技术

区块链技术云计算机器学习

深度学习技术

深度学习（deep learning）是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是机器学习中一种基于对数据进行表征学习的算法，至今已有数种深度学习框架，如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

来源：LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.

机器学习技术

机器学习是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

来源：Mitchell, T. (1997). Machine Learning. McGraw Hill.

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源，如线程、进程或数据流；也可以指硬件资源，如处理器、网络连接或扩展卡。进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态，允许多位用户有效地同时共享系统资源，或达到指定的服务质量。 see planning for more details

来源：维基百科

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

参数技术

在数学和统计学裡，参数（英语：parameter）是使用通用变量来建立函数和变量之间关系（当这种关系很难用方程来阐述时）的一个数量。

来源：维基百科

剪枝技术

剪枝顾名思义，就是删去一些不重要的节点，来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用，如：决策树，神经网络，搜索算法,数据库的设计等。在决策树和神经网络中，剪枝可以有效缓解过拟合问题并减小计算复杂度；在搜索算法中，可以减小搜索范围，提高搜索效率。

来源：Wikipedia

TensorFlow技术

TensorFlow是一个开源软件库，用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品，如语音识别、Gmail、Google 相册和搜索，其中许多产品曾使用过其前任软件DistBelief。

来源：维基百科

数据库技术

数据库，简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据运行新增、截取、更新、删除等操作。所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

来源：维基百科

神经网络技术

（人工）神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型，那时候研究者构想了「感知器（perceptron）」的想法。这一领域的研究者通常被称为「联结主义者（Connectionist）」，因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型，它们都是前馈神经网络：卷积神经网络（CNN）和循环神经网络（RNN），其中 RNN 又包含长短期记忆（LSTM）、门控循环单元（GRU）等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习，但也有一些为无监督学习设计的变体，比如自动编码器和生成对抗网络（GAN）。

来源：机器之心

特征工程技术

特征工程是利用数据所在领域的相关知识来构建特征，使得机器学习算法发挥其最佳的过程。它是机器学习中的一个基本应用，实现难度大且代价高。采用自动特征工程方法可以省去采用人工特征工程的需求。Andrew Ng 说“挖掘特征是困难、费时且需要专业知识的事，应用机器学习其实基本上是在做特征工程。”

来源：Wikipedia

特征选择技术

在机器学习和统计学中，特征选择（英语：feature selection）也被称为变量选择、属性选择或变量子集选择。它是指：为了构建模型而选择相关特征（即属性、指标）子集的过程。

来源：维基百科

结构搜索技术

深度学习提供了这样一种承诺：它可以绕过手动特征工程的流程，通过端对端的方式联合学习中间表征与统计模型。然而，神经网络架构本身通常由专家以艰苦的、一事一议的方式临时设计出来。神经网络架构搜索（NAS）被誉为一条减轻痛苦之路，它可以自动识别哪些网络优于手工设计的网络。

来源：Oreilly