Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

滴滴与全球顶级自动驾驶研究联盟BDD达成战略合作

4月25日,滴滴携手加州大学伯克利分校DeepDrive深度学习自动驾驶产业联盟(BDD)在京举办CVPR 2019自动驾驶预研讨会,会上滴滴正式宣布与BDD达成战略合作,双方将围绕智能驾驶大主题,在前沿研究及应用落地、顶尖人才培养、学术交流等方向展开全方位的积极探索。

(滴滴出行信息安全战略副总裁、美国研究院院长弓峰敏博士与BDD主任、伯克利人工智能研究院(BAIR)联合主任Trevor Darrell教授作为双方代表签署战略合作协议)

达成战略合作标志着滴滴和BDD合作关系的进一步深入。此前3月,滴滴联合BDD启动CVPR 2019 WAD自动驾驶识别挑战赛,滴滴共参与提出目标检测迁移学习、目标跟踪迁移学习、大规模检测插值三项任务,并提供一个大规模、高质量的真实驾驶场景视频数据集D²-City(https://gaia.didichuxing.com/d2city),涵盖12类行车和道路相关的目标标注,旨在鼓励相关领域前沿算法的发明与实现,有效推进自动驾驶相关视觉算法在不同环境和条件下的实用落地。

滴滴出行信息安全战略副总裁、美国研究院院长弓峰敏现场表示作为出行服务的提供者,滴滴一直非常愿意和学界、车厂、工业界及相关各方共同合作,推动全球智能驾驶技术发展和应用。Berkeley拥有全球领先的研究团队,BDD的研究重心和滴滴也高度契合,双方将继续加强在自动驾驶领域的合作交流,携手加速前沿研究的应用落地,共同培养更多具有创新意识的人工智能领域顶级人才,推动AI赋能自动驾驶及大交通领域。

BDD主任Trevor Darrell教授称,D²-City数据集的开放对于研究者的意义是非凡的,让我看到了一个行业领先者应有的担当。我们也很兴奋能和滴滴进行多元化合作,持续推进技术前沿。在今年CVPR 2019上,BDD也将联合滴滴举办自动驾驶研讨会(WAD),基于伯克利BDD100K、滴滴D²-City两个大规模、高质量真实驾驶场景视频数据集,组织目标检测、目标跟踪迁移学习挑战赛,共同加速自动驾驶领域技术创新。

预研讨会上,Trevor Darrell还现场分享了“带有好奇心与自适应性的深度学习感知、行动、解释的应用”。Darrell介绍到,最近几年,“分层的”、“深度的”表征学习极大地推动了计算机视觉的进步,但传统上仅仅限于拥有大量的训练数据且完全监督的设定,模型也缺乏可解释性。来自于对抗自适应表征学习的新结果表明了这些方法进行跨模态和领域学习时的提升,并且这些方法可以进一步被训练或约束以便为他们的用户提供自然语言解释以及多模态可视化结果。Trevor分享了通过学习特定实例的网络结构来解决个别任务的组合网络模型,以及利用好奇心定义的内在奖励的自监督的策略学习模型。

滴滴AI Labs资深研究员车正平博士、李广宇(Max Li)博士则在报告中分享了AI Labs在计算机视觉、智能驾驶等方向上的最新探索和进展,并详细介绍了AI如何通过学习分析车载大数据,让司机的驾驶行为更安全。作为全球出行行业引领者,滴滴每天会处理大量交通及驾驶数据,基于海量大数据和技术优势,滴滴也构建了驾驶场景理解平台,能基于驾驶场景理解、大数据分析与风险预测等能力,持续提升出行安全与体验。同时AI Labs也在应用海量真实驾驶数据,构建智能驾驶模拟测试环境,加速滴滴智能驾驶系统优化迭代。

加州大学伯克利分校BDD联合主任Ching-Yao Chan博士的报告题目为“当人工智能遇到自动驾驶”,介绍了他对机器学习的最新进展及其在自动驾驶中的应用的看法,包括BDD研究活动概述,机器学习自动驾驶中用例的讨论,及人工智能自动驾驶的挑战和前景。

加州大学伯克利分校博士后研究员Fisher Yu博士则和大家探讨了如何通过结合上下文的、动态的、有预测性的图像表征方法实现人类认知水平。现有的最先进的计算机视觉模型通常专注于单个领域或单个任务,而人类水平的识别可以针对不同尺度与任务。Fisher分享了在学习不同尺度及任务的环境相关的图像表征、构建可解释卷积网络行为并产出适用于广泛任务的模型框架方面的工作。这些正在进行的系统及算法研究将表征学习与现实世界的交互结合在一起来构建可以不断向世界学习并与之交互的智能体。

产业滴滴自动驾驶BDD加州大学伯克利分校
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

插值技术

数学的数值分析领域中,内插或称插值(英语:interpolation)是一种通过已知的、离散的数据点,在范围内推求新数据点的过程或方法。求解科学和工程的问题时,通常有许多数据点借由采样、实验等方法获得,这些数据可能代表了有限个数值函数,其中自变量的值。而根据这些数据,我们往往希望得到一个连续的函数(也就是曲线);或者更密集的离散方程与已知数据互相吻合,这个过程叫做拟合。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

Fisher Yu人物

Fisher Yu,加州大学伯克利分校博士后研究员,主要研究方向为图像识别的表征学习,互联网规模的视觉理解和基于视觉的自动驾驶系统。Fisher Yu曾于普林斯顿大学获得Computer Science博士学位,并在攻读博士期间,与英特尔智能系统实验室负责人Vladlen Koltun、普林斯顿大学计算机视觉与机器人学实验室创始人肖健雄进行了广泛的前沿科技研究合作,并于全球各大顶级计算机视觉会议,包括ECCV, CVPR, ICLR等,发表多篇研究成果。此外,Fisher Yu还曾实习于Qualcomm,Facebook,Google和Intel,在产业及学术领域都具有相当丰富的经验。他领导了BDD100K (bdd-data.berkeley.edu) 数据集的建设和Scalabel(www.scalabel.ai)标注工具的开发。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

推荐文章
暂无评论
暂无评论~