整理 | 杜夏德
资讯
Comma.ai 发布新的汽车通用接口「Panda」,售价 88 美元
近日,声称要取代特斯拉的自动驾驶公司 Comma.ai 发布了新的自动驾驶硬件套件「Panda」,这是继该公司去年取消的 Comma One 产品之后发布的第一款将要出售的硬件产品,售价 88 美元。放弃 Comma One 是因为该产品受到了美国国家公路交通安全管理局(NHTSA)有关合规性的警告信。
Panda 是一款微型加密狗(一种插在计算机并行口上的软硬件结合的软件加密产品),可以装在汽车上用以手机数据,而且不受 Comma One 受到的监管审查。像 Panda 这样加密狗在机械工业中的应用很多,此外像 Automatic 和 Mojio 这样的平台也会用到这中类型的接口。据 Comma.ai 的 CEO George Hotz 介绍,只要将 Panda 插入汽车上的 OBDII 端口(每辆车上都有),就可以获得关于汽车和驾驶过程的中各种数据。
DeepMind 与 OpenAI 联合研发新方法,让机器在人的指点下学习
最近,谷歌 DeepMind 和 Elon Musk 创办的 OpenAI 联合发表一篇研究文章,提出一种新的机器学习方法,机器在人类指点下学习新任务,这比让机器自己去寻找解决问题的方法要安全。
该研究解决的主要问题是,有时人工智能以最有效的方式获得最大回报是一种假象,这就好比你把所有的杂物都堆到橱柜里,然后说房间很干净。从技术上来说,房间是很干净,但是方法不对。
该研究的重点是奖励制度。DeepMind 和 OpenAI 团队并没有设计出一个机器可以通过的过于复杂的奖励系统,而是使用人工输入来奖励这个人工智能系统。当该系统按照训练人员想要的方式解决问题时,它就会积极的反馈。使用这种方法,AI 能够学习玩简单的电子游戏。虽然这是一个突破,但它还无法广泛适用:需要人类反馈,太耗费时间。
CMU 研发出新型人体检测方法,实现首次手指动作检测
卡耐基·梅隆大学(CMU)研究人员开发出一种可以实时理解视频中多个人的人体姿势移动方位的方法,该方法使计算机不仅能够识别身体的各个部位,而且能够了解它们是如何移动和定位的,同时这也是首次实现计算机识别人群中每个人的手指动作。
相较于面部表情,手部检测的挑战更大。当人们用手拿东西和做手势时,照相机不可能同时看到手的所有部分。此外,关于脸的图像,有很多经过标注的完备数据库,而关于手的标注图像数据较少。
这种方法在全景工作室(Panoptic Studio)的环境下完成,该工作室是有两层,里面放置了 500 台摄像机。经过多次实验后,研究人员发现了一种只需要一台摄像机和一台笔记本就能检测一群人的姿势。
CMU 的机器人学副教授 Yaser Sheikh 说,这些跟踪二维人的形体和运动的方法为们和机器之间的相互交流开辟了新的途径,也为人们更好地使用机器了解周围的世界提供了新途径。例如,识别手势的能力将使人们能够以更自然的方式与计算机进行交互。
应用
现实版机器人总动员,AI 机器人 Clark 进驻垃圾场里
近日,美国科罗拉多州的一家机器人创业公司 Amp Robotics 获得美国国家科学基金会的支持,致力于打造一款使用人工智能从流水线上回收可回收物品的设备。这款机器人名为 Clarks,可以在工作中不断学习。AMP 的 CEO Natanya Horowitz 说,「我们给它展示了几千个瓶子罐子等各种各种的物品,让它学习像人一样去区分这些物品。它可以学习材料的标志、形状和纹理。」
垃圾分类机器人的想法很早就出现在电影中。AMP 机器人公司认为,他们的机器人中使用了计算机视觉和机器学习技术,可以降低了分拣成本。当劳动力稀缺时,机器人就派上用场了。
目前,机器人 Clark 的软件仍需改进,错误率也需要降低。不过,Clark 已经进入了一些垃圾场,例如同在科罗拉多州的垃圾回收公司 Alpine Waste & Recycling,据该公司负责人介绍,工作 6 个月来,机器人 Clark 的表现越来越好。
颠覆传统刑侦画像手段,读取脑波可重建犯罪嫌疑人的脸
研究人员研发出一款新型大脑扫描机器,可以通过读取脑波来重建脑海中的人脸。这种听上去很科幻的技术已经研究了数十年,而且加州理工学院的科学家可能已经破解了大脑中的面部识别代码。该研究团队使用脑扫描,并直接记录猕猴脑神经元活动,并发现了大脑中存在专门的「面部补丁」,它可以对面部特征的特定组合作出反应。就像音乐调音台上的刻度盘一样,每一个补丁都能很好地调整到一组视觉信息,然后以不同的形式组合在一起,形成每一个独特面孔的整体再现。
每个表盘的值都可预测,科学家们通过记录「面部补丁」中大约 200 脑细胞的电活动来重现猴子所看到的面孔。当这些重建的面部图像与原图像放在一起时,几乎无法区分。
研究小组给猴子们展示了一系列新面孔,同时记录了大约 200 个面部斑块中的神经元,然后利用他们设计的数学模型,计算出每个神经元的编码特征以及它们如何组合。
该研究团队成员之一 Doris Tsao 博士说:「我们的研究结果表明,大脑皮层的至少一个细分可以用一个明确的、简单的模型来解释。」虽然该技术目前还没有任何直接的应用,但这些新发现最终可以引导大脑机器接口的发展,直接刺激视觉皮层使盲人恢复视力。此外还可以帮助医生理解为什么有些人患有「脸盲」。
观点
自动驾驶是一种劳动密集型产业
自动驾驶并不像听上去那么自动化,其背后隐藏着一个劳动密集型产业。大多数自动驾驶类公司已经在海外人力成本较低的国家比如印度规模化雇佣劳动力,让他们「教导」汽车识别行人,骑自行车的人和其他障碍物,也就是给这些物体打标签。
旧金山 Lemnos Labs 的一名投资人说,「标签团队对于任何一家自动驾驶公司来说都是及其重要的。」Waymo 在加州进行路测时,有超过 100 名谷歌员工帮助检查车载安全系统。即便传感器质量和计算能力的巨大进步已经成为无人驾驶革命的技术基础。然但是幕后需要大量的人工注释。Drive.ai 的 CEO Sameep Tandon 说:「注释过程通常是人们不太在意的隐蔽成本。这些工作很麻烦,甚至让人感到痛苦。然而 AI 从业者天生带有一些傲慢,认为电脑会解决一切。」
在自动驾驶行业的竞争中,衡量进度的标尺之一是车辆进行测试的里程数。今年五月,Waymo 表示,其汽车已经测试了三百三十公里的公共道路,而去年特斯拉收集了超过 100 公里的测试数据,以帮助其开发自动驾驶仪系统。更多的里程就意味着幕后更多的手工数据处理工作。车辆行驶几英里产生的数据可达数十 G,数据量过大,无法通过无线上传,需要人工操作。前 waymo 工程师 Anthony Levandowski 在加州大学的一次演讲中说,谷歌街景在印度的一个地图标签团队成为「人肉机器人」。地图标记所需的人力成本并不便宜。据业界估计,美国每个城市花在地图维护上的成本是每年数十亿美元。
图说
农业科技公司融资交易猛增
根据 CB insights 的数据,在过去 5 年中,农业科技创业公司已经募集了超过 8 亿美元的资金。与医疗、金融等领域相似,自 2014 年起,农业领域的人工智能或机器人创业公司的融资交易开始猛增。
Bessemer Venture Partner、Accel Partner、Khosla Ventures,、Lux Capital 以及 Data Collective 多家风投公司都在投资通用型无人机和专注于农业领域的计算机视觉公司,比如大疆和 Orbital Insight,还有农业科技创业公司 Blue River Technology等。孟山都和先正达等农业科技巨头也积极参与到这场投资大军中。
CB insights 列出了专注于农业科技的人工智能创业公司,并将它们按照应用方向划分为五类:
- 卫星图像分析:分析卫星图像提供了对农业实践的宏观层面的理解。地理空间数据可以提供全球作物分布格局以及天气变化对农业影响的信息。该领域的热门创业公司 Orbital Insights 目前总共融资 7870 万美元,其投资方包括 Lux Capital,、Sequoia Capital,、以及 Google Ventures 等知名投资机构。
- 田野监测:这一类包括专注于农业的无人机制造商,以及处理相关数据的计算机视觉算法的公司。
- 作物及土壤热度评估:这一类的创业公司大多使用机器学习预测各种微生物对植物健康的影响,以及识别病原体和可能有害于植物的基因突变。
- 农业机器人:这一类创业公司主要研发执行各种农业任务的地面机器人。
- 预测分析:这类初创公司使用机器学习模型进行季节性分析、建模不同的市场场景,以及优化业务成本等。