2019/05/29 15:38

从相机标定到SLAM，极简三维视觉六小时课程视频（附PPT）

谭平教授是加拿大西蒙弗雷泽大学副教授。不久前他与浙江大学合作了一系列三维视觉课程，内容涵盖相机标定、多视几何等多个方面。机器之心简要介绍了该系列课程，希望能够对读者学习三维视觉技术有所帮助。

课程内容简介

任何把相机连接到计算机的工作都不能忽视三维视觉。近年来，视觉 SLAM 技术发展势头迅猛，AR／VR、无人机、机器人、自动驾驶方面的公司都在大量招聘了解这方面技术的人，但熟悉该领域的人才却非常稀缺。

谭平教授表示，2016 年他在北京筛选了近 200 份简历，最后只发出去两个 SLAM算法岗的 offer。许多人只是用过开源代码，有的对代码做过一些定制化，但对算法的原理了解很少。比如，很少有人能说清楚为什么 ORB SLAM 需要两种不同的初始化方式，也没有多少人能讲清楚旋转矩阵的参数化方式。

因此，谭平教授借在浙江大学讲课的机会，把三维视觉部分的课程录像发布在网络上，同时也共享了讲课的 PPT。

该课程一共是三周的课时，时长约六小时。内容涵盖相机标定、多视几何、structure-from-motion、SLAM 等方面。课程适合初学者或是想回顾基础知识的同学。

视频链接：http://list.youku.com/albumlist/show/id_52188378.html
PPT 资源链接：https://pan.baidu.com/s/1w_ucOJBou-Fi0Li7H_zaaw
提取码：oomy

下面我们将简单介绍其中的一节课 SLAM。

SLAM 技术

SLAM 的全称是 Simultaneous Localization And Mapping，是一种帮助机器人实现定位与地图构建功能的方案或技术。它早期用于军事核潜艇中的海底定位，现在广泛应用于机器人、无人机、自动驾驶、VR 和 AR 领域。

谭平教授主要从三部分介绍 SLAM 技术：基于激光雷达的 SLAM（LiDAR SLAM）、视觉 SLAM（Visual SLAM），以及提升稳健性的技术（Robustness Techniques）。谭教授希望首先通过 LiDAR SLAM 的讲解带大家了解 SLAM 的基础模块，然后了解如何用视觉方法实现这些基础模块，即实现 Visual SLAM，最后介绍 Visual SLAM 里面用于提升稳健性的常用技术。

谭平教授首先简要介绍了 SLAM 的基础概念、视觉 SLAM 的 demo 及应用场景。之后以 2D LiDAR SLAM 为例，介绍了 SLAM 中的基础模块。

此外，谭平教授还介绍了 LiDAR SLAM 和 Visual SLAM 的基础架构。

这节课的第二部分介绍了 Visual SLAM，主要探讨了 Visual SLAM by SfM（SfM 在前一节课中已经详细介绍过）、Key‐frame based VisualSLAM、Parallel Tracking and Mapping (PTAM)。其中重点介绍了 PTAM 的原理和具体步骤。

在这节课的第三部分，谭教授讲解了 Re‐localization、解决 Drifting 问题的 Loop Closure 等提升稳健性的技术。视觉 SLAM 面临很多挑战，因此需要这些高级功能来提升它的稳健性。

最后，谭教授简要回顾了视觉 SLAM 的历史，感兴趣的同学可查看课件中总结的研究。

讲师简介

谭平博士是加拿大西蒙弗雷泽大学 (SFU) 副教授，在此之前是新加坡国立大学 (NUS) 副教授。谭博士于 2007 年从香港科技大学获得博士学位，一直从事计算机视觉，特别是三维重建、视觉 SLAM 方面的研究工作。他是 IJCV、CGF、MVA 等学术杂志的副主编，并担任计算机视觉、图形学、机器人方面的学术会议领域主席，包括 CVPR 领域主席，SIGGRAPH、SIGGRAPH Asia 的程序委员，IROS 的副主编。

入门SLAM浙江大学SFU谭平三维视觉

3 1

相关数据

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来（Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)），自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展，但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个：首先，在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境，从而进行实时推论。第二，信息性决策需要准确的感知，目前大部分已有的计算机视觉系统有一定的错误率，这是自动驾驶导航所无法接受的。

来源：机器之心

激光雷达技术

自动驾驶车辆传感器的一种，采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性，这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题，同时，它的机械结构非常复杂。

来源：机器之心

参数技术

在数学和统计学裡，参数（英语：parameter）是使用通用变量来建立函数和变量之间关系（当这种关系很难用方程来阐述时）的一个数量。

来源：维基百科

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

无人机技术

无人机（Uncrewed vehicle、Unmanned vehicle、Drone）或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

来源：维基百科

港科大机构

香港科技大学（The Hong Kong University of Science and Technology），位于中国香港，简称港科大（HKUST），为环太平洋大学联盟、全球大学校长论坛、东亚研究型大学协会、亚洲大学联盟、中国大学校长联谊会重要成员，并获AACSB和EQUIS双重认证，是一所亚洲顶尖、国际知名的研究型大学。该校以科技和商业管理为主、人文及社会科学并重，尤以商科和工科见长。截至2019年9月，学校设有理学院、工学院、工商管理学院、人文社会科学学院等4个学院及跨学科课程事务处；校园占地超过900亩，有教员697人，各类学生16054人，其中本科生10148人，研究生5906人。

https://hkust.edu.hk/