这是一个「微软亚研系」创业组合。
「很可惜的是,微软亚洲研究院在自动驾驶领域并没有很多投入,而自动驾驶是行业发展的必然趋势,我们想顺应这个趋势,就决定出来试一试。」蔡锐说道。
一年前,他和深动科技其他三位联合创始人离开微软亚洲研究院投身自动驾驶领域。
从技术层面考虑,自动驾驶可以看作是机器人的拓展,但却能在本质上改变人类的出行方式和生活习惯。而公司的四位联合创始人都具有计算机视觉、机器人技术相关的研究背景。
尽管此前在亚研院的主要工作成果没有直接关联性,但这十年自由的研究经历让他们「在把算法做成产品以及通过产品的需求改善算法方面,得到了很多积累和锻炼。」
同时,也更清晰认识到,「我们更喜欢让技术转化成产品,然后让人真的把它用起来。」
在蔡锐看来,「人从驾校毕业后上路也难免遇到磕磕碰碰,要成为老司机,人要不断开车上路,体验更多的路况、应对更多的情况、看到更多的数据。相应地,自动驾驶的进化也有赖于数据的积累,而地图是数据中最核心的一部分。」
由此,成立于 2017 年 7 月的深动科技确定了定位——地图数据为核心切入点,并研究自动驾驶的感知和定位这两件事。
创业之初,团队拿到了数百万美元的天使轮投资。2018 年 3 月,深动科技获得了红点中国领投的千万美元 A 轮投资,天使轮投资方源码资本继续跟进。
感知、定位、地图:你中有我、我中有你
高精地图之于自动驾驶的重要性毋庸置疑。
「地图、感知与定位一定不是分离割裂的,必须是紧密的、有很强互动关系的。」蔡锐说道。
具体理解起来,有了高精地图,感知可以做的更快、更好,定位可以做的更准、对硬件的要求也可以适当降低。
举个例子,自动驾驶汽车在到达路口的时候,感知模块会首先基于地图信息判断红绿灯的位置,从而掌握哪个红绿灯的信息有效,以便在特定区域收集信息,提升了算法的处理效率和精度。
同时,地图的构建与感知模块在底层技术上有许多可以分享的部分,例如车道线的检测等。在此基础上,地图还要恢复各种元素的空间位置。掌握更多汽车周围的环境数据也对系统后续进行的决策环节更加有利。
深动科技的感知解决方案选择以摄像头为主,辅以低线速的激光雷达和毫米波雷达,利用算法描绘出自动驾驶车辆周围环境中物体的位置信息。
而除了在地图中构建如车道线、路牌、红绿灯、路面施画等基础组件之外,深动科技还会根据客户的需求为解决方案中增添路灯、不同材质的隔离护栏等各式内容。
要做到这一点,迅速地收集训练数据、标注数据、进而转化为自动识别的能力尤为关键。
这不难理解,要实现感知、建图的自动化也就是要提高数据处理的自动化程度。目前看来,AI 算法间的差异并不大,性能的差异主要还是取决于训练数据的规模以及质量。
只有机器看见了足够多的样本,适应了足够多的场景,算法才能真正成为一个老司机。
在最初机器什么都不认识的情况下自然需要人工标注,而当数据的价值得到体现,机器可以识别信息后,团队会让机器再次筛选样本,把那些当下算法无法处理的样本拿给人工进行进一步加工,以保证合理的资源分配。
「数据的收集、标注涉及的是成本和开销问题,肯定要把有限的资源放在机器还不能准确识别的部分。」蔡锐解释道,深动科技会提供数据标注的算法、平台以及审核环节,具体的标注工作还是会众包出去。
在定位方面,主要的定位信息源一般来自 GPS 和惯导。其中,GPS 承担绝对定位任务,惯导提供短时间内车辆位姿的相对变化。GPS 与惯导的组合也不能完全保证自动驾驶汽车在全工况的情况下具备鲁棒性,比如较长的隧道等区域。
为此,深动科技添加了一个视觉信号源,通过视觉与高精地图元素的比对,有助于确定自动驾驶车辆的精确位置。用蔡锐的话说,就是「把眼睛睁开了」。
深动科技的众包高精地图解决方案以摄像头为主,辅以消费级的 GPS 和惯导,并设计了一套名为 DM-100 的原型设备。
这套方案的特别之处在于,用价格相对低廉的 GPS 和惯导代替专业级定位设备,在完成厘米级精确定位任务的同时实现了成本的控制。
在与合作伙伴沟通的过程中,蔡锐也发现,业内普遍共识是自动驾驶是一个逐步变化的事情,所以对成本控制的愿望很强烈。
目前,许多自动驾驶汽车上部署的定位设备价格区间在上万元至几十万元,而 DM-100 原 型设备上的 GPS+惯导单元的成本在百元左右,整套设备的价格控制在 1500 元以内。
「我们认为自动驾驶相关的算法和硬件一定要有一定的耦合度,只有硬件与软件的高度配合,才能在性能上有更好的提升,因此自己设计了整套采集设备。」蔡锐说道。目前,这套 DM-100 原型设备只是给合作伙伴的一个参考设计方案,而非一款销售产品。
希望我们的下游是一个湖面
「我们本身是一个处于相对上游的算法提供商,但希望我们的下游不是一个很窄的河道,而 是一个湖面。」蔡锐解释道,地图数据供应商、车厂、tier1,还有自动驾驶创业公司,都可以成为深动科技的合作伙伴。
「这是一个分工合作的行业,一家公司很难把一整套全做下来。」蔡锐说道,「所以现在这个 阶段我们更愿意提合作,不愿意提竞争。」
眼下,高精地图领域还没有现成的行业标准,每家的定位技术也不尽相同,所以很多时候地图数据供应商提供的数据并不满足自动驾驶公司的需求,使得一些公司不得不在与图商寻求合作的同时尝试自主绘制高精地图。
一般来说,现在普通的地图误差在 10 米左右,而定位精度更小、可以提供更准确信息的地图就称得上是高精地图。尽管米级精度的地图仍无法满足 L4 级别自动驾驶的需求,但已经可以在 HUD 的增强显示等功能上发挥作用了。
在蔡锐看来,如果地图已经能带来一些更好的用户体验了,那么这个地图是不是叫高精地图也不那么重要。目前,深动科技的定位精度可以达到 10 到 20 厘米。
除了标准和政策限制,在高精地图领域,高昂的建图成本限制了地图的更新频度和活性,也是所有专注高精地图的公司面临的难题之一。
在主动采集的模式下,地图的更新往往按月或是按季度,更新频率最高的通常是景点、商场、饭店等 POI(电子地图上的信息点),其次是地面的标线施画,最后才是路网结构。
蔡锐介绍,通过比对行车环境信息与现有地图中的数据,云端可以整合判断来自不通车辆上传的数据,排除误报,完成更新。在数平方公里的测试规模下,深动科技的解决方案从车端提交信息到云端完成整合的时间是分钟级。
为了实现高频更新,必须保证设备具备可部署性。首先,在算法设计上要采用一些消费级的传感器以降低整个设备的成本;同时还要提升算法的自动化程度,减少技术人员的介入。
「这里的门槛还是很高的,要朝着量产和可部署去的话,就不能用很多高成本的硬件。」蔡锐说,「要基于消费级的硬件实现高精度的性能,需要在算法层面将深度学习与立体视觉等技术用到极致。」
当然,蔡锐口中的量产并非传统意义上的量产。「这个事情不会一口吃个胖子,肯定有一个很长的迭代过程。其他行业的量产在自动驾驶行业不是那么的恰当。」
在蔡锐看来,哪怕只有几十台车辆投入生产和运营,就算是技术成功的落地。「所以我更愿意讲落地。」