Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

刘晓坤 张倩作者

MIT 2019深度学习课程开课,第一课视频&PPT已放出

MIT 2019 年为期一个月的深度学习课程已于月初开课,包含自动驾驶汽车的深度学习深度强化学习、以人为中心的人工智能等主题。目前,课程第一课——《深度学习基础》视频和 PPT 已经放出,其余部分也将陆续发布。

课程地址:https://deeplearning.mit.edu/

这个网页集合了 MIT 开设的深度学习深度强化学习自动驾驶以及人工智能的免费课程和讲座视频,讲师是 Lex Fridman。2019 年的最新视频会在这个月开始陆续更新。

Lex Fridman 是 MIT 的研究科学家,致力于以人为本的人工智能,兴趣是开发感知规划人机交互深度学习方法,最近由于视频中的认知负荷估算工作获得了 2018 年 CHI 最佳论文荣誉奖。

课程主题及时间表

以下是每门课程的主题和时间表,课程结束后几天就会放出免费视频。

  • 6.S094:自动驾驶汽车的深度学习(第 1、2 周)

  • 6.S091:深度强化学习(第 3 周)

  • 6.S093:以人为中心的人工智能(第 4 周)

6.S094 的课程部分包括三部分:深度学习基础、自动驾驶汽车:2019 年的当前最佳技术、GAN语义分割

第一课视频及 PPT

自动驾驶汽车的深度学习」部分的第一堂课——《深度学习基础》已于 1 月 7 日开课,目前已经放出了视频和 PPT。

第一节课《深度学习基础》主要介绍了:

  • 简介

  • 一张幻灯片了解深度学习

  • 深度学习思想和工具的历史

  • TensorFlow 简单示例

  • 一张幻灯片了解 TensorFlow

  • 深度学习表征学习

  • 为什么要使用深度学习

  • 监督学习的挑战

  • 关键的低级概念

  • 更高级别的方法

  • 走向通用人工智能

GitHub 上的有趣实现

在相关 GitHub 页面中,MIT 提供了几个有趣的实现,可以在 Colab 或 Jupyter Notebook 上运行。如下图所示,使用 DeepLab 对来自 MIT 驾驶场景分割数据集的样本视频进行语义分割

项目地址:https://github.com/lexfridman/mit-deep-learning

科技公司高管讲座

在讲座部分,MIT 邀请了众多来自科技公司的自动驾驶研究院的科学家,包括英伟达、奥迪、Voyage、Waymo 和 Aptiv。

后面的两门课程中,6.S091 包含深度强化学习入门、基本原理和当前最佳研究的概述;6.S093 包括主题包括用深度学习理解人类的情绪、面部身份、认知负荷、身体姿势、自然语言处理等。

往年课程

如果第一部分视频看不够,还可以看看往年的课程视频,也都在同一个网页上,如下所示。

常见问题解答

为了回答求知者的疑问,Lex 老师提供了一个答疑文档。

文档地址:https://docs.google.com/document/d/1ZqgghxV1lpZeWUv5zNK0gMUBHfYTw9n6eYzzx9j8nok/edit#

以下是文档的部分内容:

Q:教学和嘉宾讲座的视频是否会发布?何时发布?

A:会的!我相信每个人都能免费获取这一课程资料。在少数情况下,嘉宾不愿意放出自己的讲座视频,请大家尊重他们的意愿。当然,我会尽量说服他们,让每个人都能免费获取这一教学资源,从而受到更多启发,以改善人工智能系统并造福世界。我们会在视频录制后尽快发布在 https://www.youtube.com/lexfridmanhttps://deeplearning.mit.edu/

Q:该课程有直播吗?

A:没有。

Q:上这门课需要什么预备知识?

A:没有正式的预备知识要求,但具备 Python 和 Javascript 的基本知识可能有助于你做出一个神经网络,这是本课程组织的竞赛之一。

Q:可以上手的项目何时发布?

A:我们正在努力创建一些面向所有人的有趣项目,创建完成后会通过网站、邮件、Slack 及其他渠道发布这些项目。


参考内容:https://www.reddit.com/r/MachineLearning/comments/afb8j0/d_mit_deep_learning_basics_introduction_and/

理论MIT深度学习课程
4
相关数据
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

Jupyter技术

Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等 。

推荐文章
暂无评论
暂无评论~