Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

高静宜撰文付博编辑

低速和园区驾驶就意味着简单?这家神秘的自动驾驶创业公司告诉了我们所有真相

大约八个月前,也就是 2017 年的 9 月,肖健雄在美国硅谷接受了机器之能的专访(AutoX创始人肖健雄:让自动驾驶变的和电脑一样普及

当时,他所创办的自动驾驶公司 AutoX 成立不到一年的时间,就已经在对外公布的测试视频中展现了不同天气情况下依靠低成本摄像头的自动驾驶解决方案。与此同时,肖健雄个人也以企业家身份获得入选了当年 MIT Tech Review 评选的 35 Innovators Under 35。(这是由美国科技媒体 MIT Tech Review 自 1998 年创立的一项年度科技人物评选,旨在表彰全球 35 岁以内最杰出的 35 位创新人士) 

一时间,这家公司风头无两,不少业内外人士都对 AutoX 饱有期待并持看好态度。

可自那以后,AutoX 就销声匿迹了。相较于业内其他自动驾驶创业公司的高调秀战果,大小新闻频频曝光,AutoX 却并没有再对外发出声响。

尽管自成立以来 AutoX 本身就笼罩着一层神秘的色彩,但长时间的沉寂仍不禁让人发出疑问:

究竟这家公司走到什么程度了?

是在闷声发大财,还是被后起之秀拍在了沙滩上?

是在商业和运营模式上走向了岔路正在求生,还是处于重大转型的过程中苦于埋头研发技术?

在我们的不断追问下,肖健雄向机器之透露了公司的最新进展、解决方案的升级以及商业方面的新动向:

「过去的一年里,我们专注于技术的产品化,现在比较成熟,开始落地试运营了。我觉得我们是在做减法,不算是转型。」肖健雄如是说。

从 LN 到 L4,锁定无人车送货场景

「我们公司的定位是平民化自动驾驶,但其实很多人对这个概念有所误解。」

肖健雄解释说,追求低廉的成本只是平民化自动驾驶的一个方面,公司更想传达的内涵其实在于服务于每个人每天最基本的需求。

因此,AutoX 选择专注在同城范围内与生活息息相关的自动驾驶场景,如外卖配送、快递送货以及出行服务等,而码头、矿山等距离普通人生活相对较远的驾驶场景则不是 AutoX 关注的重点。

没错,就是俗称的「最后一公里」任务。

在他看来,这些普通人生活必然涉及的行业中的最大痛点是运力之争。

「只有解决了运力问题,人们才能把时间花在更有意义的事情上,才能真正提升生活水平。」肖健雄强调。

这不难理解,人们无论在点外卖、上网购物、还是叫专车接送的过程中均面临这一问题。如果没有足够的运力,这些日常任务自然会变得难以为继。

为此,AutoX 部署了三款不同的车型。 

第一款就是改装自林肯 MKZ 的原型车,即在乘用车上部署自动驾驶技术,这也是业内不少公司瞄准的一个最常见的商业场景。

另外两款则是针对送货场景,分别为低速的无人送货小车以及可以任意速度行驶的无人送货货车,这也是 AutoX 首次披露的具体应用场景。AutoX 低速无人送货车(左)以及 AutoX 全速无人送货车(右)

据了解,AutoX 的低速无人送货车长约一米,宽不足一米,并非基于现有的车型改装而成,而是在与合作伙伴和供应商一起从零打造,可以在园区、住宅区等场景下完成较小物体的送货任务。

而 AutoX 的全速无人送货车则是基于微型面包车改装而成,能够完成较大物体的运送。

对于园区中的自动驾驶任务,很多人觉得难度根本不能与普通城区道路上行驶的自动驾驶汽车相比,但实际情况其实并不是如此: 

实际上,园区场景下的路况就极度复杂,不仅有来往的行人,还有单车、摩托车的频繁出现。肖健雄把低速无人送货车的自动驾驶系统形容为一个「更聪明的脑子、但身体动得更慢」。

「这里的交通规则比普通路面上的更灵活,混合着结构化和非结构化的道路,所以有时甚至比在高速上行驶还要复杂,所以要更聪明一些。」他解释道,「但好处就是园区里是低速行驶,在同样的处理和反应速度下,不会有高速上的严重危及生命安全情况。」

此外,任何技术的产品化、商业化的同时,落地所产生的问题也与随着而来,而这些问题又返回成为技术上的挑战。

肖健雄举了一个例子,如果送货车停在园区某处等人取货时,周围有人倒车,无人车被卡住怎么办?

「这就不止要做自动驾驶的 AI,还要做很多落地所需要的 AI。可以尝试用人机交互的方法,让车主可以把无人车挪开,但又不能挪得太远以免撞到他人。」

他补充道:「我们还有后台的调度系统、API,也提供手机 APP 以使用、调度这些车辆。这些都是我们过去几个月里一直在忙的东西。」 

肖健雄告诉机器之能,目前,AutoX 在送货场景下的解决方案已经处于「Ready」状态,已经有一些合作伙伴和客户开始试用,并逐渐走向落地。

其实,在之前的采访中,AutoX 的对外口径还是其技术解决方案实现的是 L2、L2.5、L3 等级的自动驾驶水平。而这次在接受机器之能采访时,肖健雄则表示,公司现在更专注在 L4 级别的自动驾驶上,公司持有的三款车型均是如此。

「我们想尽快面向市场,如果做 L2 的话,就要走与车厂、Tier1 合作的传统道路,周期比较长,这对一个初创团队来说不是特别合适。反而是做 L4 的商业模式会更快地完成落地。」肖健雄解释道。 

肖健雄表示,之所以决定聚焦在限定场景下的 L4 级自动驾驶,从某种意义上讲就是希望最快速落地。

他笑着引用了一位投资人朋友的话——「大将军赶路不追小兔」。

在 AutoX 的时间表里,送货无人车在今年上半年可以达到几十台的量级水平,下半年则会达到几百量级。值得一提的是,这些数量级并非公司内部测试车辆的数目,是试运营的车辆数量。

不过,AutoX 并未透露具体的合作伙伴,只表示公司的合作伙伴围绕生活服务领域,聚集在电商、物流、外卖、新零售等领域。

如果具体到「怎样赚钱」,AutoX 的盈利模式有两种,分别为长租和短租。

短租就是按使用的次数和时长收费,长租就是包年、包月去做运营。如此一来,AutoX 的身份就不再局限于一家自动驾驶技术提供商,而是成为了一个运力平台提供商。

对于 AutoX 来说,这个完整的新商业模式无疑是经历了技术升级与行业探索后的升级版本。

而在融资信息和团队规模上,AutoX 依然保持神秘。

从只言片语中,机器之能了解到,目前公司已经完成了 A 轮融资,而且公司的办公地点也从车库创业换到了一个很大的办公大楼,团队数目大大增加,管理趋于规模化。 

不只摄像头,构建有冗余的传感器融合方案

「在这里要澄清一点,我们是以摄像头为主,camera-first,其他传感器为辅,并不意味着我们不用其他类型的传感器。」

在去年三月发布的测试视频中,AutoX 在改装的林肯 MKZ 原型车上装配了 7 个单目摄像头,在下雨的天气路况下,顺利完成了无人车的行驶,展现了团队在基于摄像头的视觉技术上的实力。

而自今年 Uber 发生撞人事故之后,有冗余的多传感器融合方案似乎成为了一种业内共识,相比之下,仅依赖摄像头的低成本自动驾驶解决方案则成了众矢之的。 

肖健雄告诉机器之心,其实团队从创始早期就一直有投入一定的资源把激光雷达融入其系统中。

他早年在普林斯顿大学视觉研发团队做研究时,就首创把深度学习的方法扩展到三维点云上处理,发表了这个领域开创性的几篇论文。

「只不过当年学校里比较穷,三维点云不是来自昂贵的激光雷达,而是用 RGBD 相机,但原理上没有任何区别。」他回忆道,「做激光雷达比做相机的感知系统会容易很多,达到比较好的效果的技术门槛相对较低。」

其实,在早前接受采访时,肖健雄也表示并不排斥激光雷达,当时他的观点是,「在目前这个阶段,摄像头应该扮演传感器中的主角」。

现在,AutoX 的技术解决方案则拥有三层防护。

第一层以摄像头为主,第二层是激光雷达,第三层则视具体场景而定,高速场景会使用在金属、汽车上表现较好的毫米波雷达,而在低速场景下,如园区等,则会选用人体检测效果较好的超声波雷达。

肖健雄介绍,AutoX 在激光雷达的使用上还要看具体场景。行驶速度较高的场景下会选择相对高线速的激光雷达,例如 40 线,而行驶速度较低的场景下则会选取 16 线激光雷达产品,在速度低到一定程度时甚至会用 1 线的激光雷达,承担一个提供冗余的任务。

在被问到是什么原因促使团队真正开始决定在商用方案上添置激光雷达时,肖健雄答道:

「从我们基于摄像头的系统研发告一段落,并且开始筹备产品落地,就开始把多传感器融合加入到商用方案上。后来激光雷达降价了,而且我们只用一个,也不是非常贵,价格还是可以接受的。」

事实上,激光雷达的价格下降趋势是肉眼可见的,今年 1 月,Velodyne 就宣布其 16 线激光雷达产品在全球范围内价格下降一半,从此前的 8000 美元降至 4000 美元。与此同时,固态激光雷达的落地也在推进当中,一些厂商把量产计划定在了今年。

在肖健雄看来,尽管从长远来看,也许五年后,摄像头就足够了,可能不会再用激光雷达了。但在早期加上激光雷达会确保安全性。

「还有一个现在的社会现实,就是如果自动驾驶车头顶上没顶个『小包包』,用户反而觉得不自然。」

除了加入激光雷达,AutoX 的摄像头传感器方案也有升级——在此前 7 个单目摄像头的基础上,为前向增加了一个新的摄像头,旨在看得更远。

肖健雄解释,激光雷达存在的一个问题就是,在近距离时表现良好,但没办法看得太远。

「许多厂商做广告说他们的激光雷达可以看二百米,但其实真的就只是广告而已。由于低分辨率,其实做物体检测时,激光雷达的稳定检测范围很难超过 50 米。」

可是,当车速达到一定程度,发生异常事件时,系统的反应时间也相对较小,感知距离的局限性在这种情况下有害无利。例如,车速为 70 公里每小时的情况下,50 米开外发生异常事件,刹车反应时间也只有 2 秒。而这种情况下,其他传感器获取的信息量也十分有限。

「我们的解决方案在比较远的距离基本依赖摄像头,以便提早判断一些事情的发生。」

当然,摄像头与激光雷达的共存就势必会提到传感器融合的问题,涉及语义分析、语义切割、目标检测等工作。在此基础上,许多自动驾驶领域内的创业公司或是学术机构也会展开目标跟踪、目标预测等工作。

肖健雄表示,AutoX 在这一步骤上的独特之处在于,其解决方案不是在图像频域上完成的,而是把二维信息映射到三维世界里,再与激光雷达紧密融合,进而实现壁障等决策规划任务。

当然,大量的计算处理离不开算力的支持。

目前,AutoX 在低速场景下使用了英特尔 8 核 i7 处理器以及英伟达移动版 GTX 1070,而在高速场景下则使用英特尔 12 核 i7 处理器以及 3 块 GPU。接下来的几个月,团队计划将 GPU 数目精简到 2 块,这也是未来的重要优化方向之一。

「我们不做芯片,专注于全套系统开发。我们有自己的计算平台,也开发了自己的电路板。」肖健雄解释道,「如果说 Apollo 平台是 Android 安卓模式,各家主机厂可以拿它定制化到自己的车辆平台上。那我们公司走的则是 iPhone 模式,我们是一整套的软硬件集成解决方案,包括三维地图、硬件传感器、计算平台、后台监控、云端服务、也包括 APP、某个应用场景中的 API。」

产业AutoX自动驾驶肖健雄
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~