Luminoth 是一个开源的计算机视觉工具包,目前支持目标探测和图像分类,以后还会有更多的扩展。该工具包在 TensorFlow 和 Sonnet 上用 Python 搭建而成,易于使用、训练、理解结果。本文介绍了 Luminoth 及其安装过程。
GitHub 页面:https://github.com/tryolabs/luminoth
Luminoth 是一个开源的计算机视觉工具包,目前支持目标探测和图像分类,但以后会有更多的扩展。该工具包在 TensorFlow 和 Sonnet 上用 Python 搭建而成。不过,该工具包只具备内部测试版品质,即内部和外部接口(如命令行)非常可能随着代码库的成熟而变化。
下面,我们来看一下 Luminoth 的特点:
开箱使用
Luminoth 是一个开源的工具包,简单易用。
可定制的目标检测和分类模型
使用自定义数据轻松训练神经网络,实现目标检测和分类。使用的是当前最优的模型比如 Faster R-CNN。
在 TensorFlow & Sonnet 上搭建
Luminoth 建立在谷歌深度学习框架 TensorFlow 和 DeepMind 的图形库 Sonnet 上。
训练过程简单
只需要键入 lumi train 就可以训练模型。可以在本地训练,或者使用 Luminoth 内置的谷歌云平台支持在云端训练模型。
训练完成之后,你可以使用 Tensorboard 集成可视化进展和中间结果,还可使用不同的数据分割对模型进行评估。
结果易于理解
可视化结果的能力一直很重要,尤其在计算机视觉领域。在模型训练完之后,使用我们的 UI 或者命令行接口,即可获得容易理解的摘要(summary)和结果的图可视化。
接下来,我们看一下 Luminoth 的安装过程及使用的注意事项。
安装
Luminoth 现在支持 Python 2.7 和 3.4–3.6。
如已安装 TensorFlow 和 Sonnet,Luminoth 将使用已安装的版本。
CPU 支持的安装
只需运行:
$ pip install luminoth
如果你的电脑上没有 TensorFlow 和 Sonnet 的 CPU 版本,则运行以上命令安装这些版本。
GPU 支持的安装
1. 安装 GPU 支持的 TensorFlow(https://www.tensorflow.org/install/)。
2. 安装 GPU 支持的 Sonnet(https://github.com/deepmind/sonnet#installation):
$ pip install dm-sonnet-gpu
3. 从 PyPI 中安装 Luminoth:
$ pip install luminoth
从数据源安装
首先,将 repo 复制到你的电脑上,然后使用 pip 进行安装:
$ git clone https://github.com/tryolabs/luminoth.git
$ cd luminoth
$ pip install -e .
检查安装是否有效
只需运行 lumi --help。
支持的模型
目前,我们支持以下模型:
- Object Detection
我们计划近期增加对更多模型的支持,如 SSD、YOLO 和 Mask R-CNN。此外,我们还致力于在 Pascal VOC2012 等流行数据集上提供预训练的检查点。
使用
运行 lumi 命令时,有一个主要的命令行接口可供使用。如果你对如何操作感到疑惑,只需键入:lumi --help 或 lumi <subcommand> --help,将会出现多个可用选项以及具体描述。
如何处理数据集
详见https://github.com/tryolabs/luminoth/blob/master/docs/DATASETS.md。
训练
关于如何在本地训练或在谷歌云中训练,请查看https://github.com/tryolabs/luminoth/blob/master/docs/TRAINING.md。
结果可视化
我们试图获取有用、易于理解的摘要和图可视化。我们认为这不仅对于监督是必要的,对于增加对内部运行机制的理解同样大有裨益。这也使代码易于理解、容易学习,计算图也是如此。
摘要和图日志(graph log)的默认存储位置是/tmp/luminoth。你可以运行以下命令来使用 TensorBoard:
tensorboard --logdir /tmp/luminoth
名称来源
黑暗视镜是游戏《银河战士 Prime 2 黑暗回音(Metroid Prime 2: Echoes)》中的一款装备。它由 Luminoth 设计而成,可在与 Ing 的战斗中穿透黑暗 Aether 的烟雾。
License
Copyright © 2017, Tryolabs. Released under the BSD Clause-3.