资讯
福尔德投资激光雷达公司 Innoviz,锁定 L3/4 自动驾驶
近日,汽车供应巨头德尔福宣布与激光雷达公司 Innoviz 签署新的合作协议,旨在为自动驾驶和高科技解决方案提供新的动力。激光雷达是自动驾驶汽车的关键部件,它能提供车辆周边环境极其精确的高精细 3D 图像。目前以 Velodyne 为主的的激光雷达供应商,其产品都十分昂贵,无法用在消费级汽车上。Innoviz 一直专注于开发体积更小、价格更便宜的激光雷达。通过此次合作,福尔德将把 Innoviz 的激光雷达传感器集成到其自动驾驶系统中。德尔福的目标是达到 L3 和 L4 级别的自动驾驶能力,同时提供可量产的商业化方案。
亚马逊携手亚利桑那州立大学,鼓励学生开发语音助手
近日,亚马逊与亚利桑那州立大学(ASU)达成一项合作协议,鼓励学生参与语音助手开发。作为合作的一部分,亚马逊将为 ASU 捐赠 1600 台 Echo Dots,同时为现有的课程提供相关的开发者工具包。这些 Echo Dots 将被放在 ASU 工程学院的宿舍,供学生免费使用。与此同时,学生在语音交互界面相关的课程中也将学习到 Alexa 的相关技能。
自从在 2014 年推出 Echo 以后,亚马逊一直积极鼓励第三方开发者为 Alexa 赋能,还表示将为表现最好、参与度最高的语音 App 给予资金奖励。有评论称,此次亚马逊另辟蹊径,与高校合作,从学生出发,其目标仍然让 Alexa 进入到尽可能多的设备中,在刚刚起步的语音计算市场占据先机。
3D 打印机器人手语翻译问世,从打印到组装完成需 149 小时
比利时安特卫普大学的一个团队正在开发一种名为 Project Aslan 的机器人手语翻译器,可以将文本翻译成手语手势,团队的最终目标是建立一个表现力强大的双臂机器人,以充分表达复杂文本和口语内容。Project Aslan 由 3D 打印的 25 个塑料部件和 16 个伺服电机、3 个电机控制器、Arduino Due 微电脑和其他电子部件组成。据悉,这 25 个塑料部件需要 139 个小时的打印时间,而完成最终组装还需要 10 个小时。通过一个被称为「fingerpelling」的字母表系统,该机器人能够用单独的手势表达每个字母。目前,安特卫普大学研究人员正在通过一个名为 3D Hubs 的全球 3D 打印网络进行分发,以确保机器人手臂可以在任何地方打造。
应用
将 AI 用于动画制作,迪士尼让 3D 动画更逼真
近日,迪士尼和 CMU 合作建立的实验室发表论文称,通过引入一种简单有效的深度学习方案,可以自动生成与输入语音同步且自然的语音动画。研究人员首先对人类语音进行采样,再训练系统识别各个语音单元所对应的嘴型和面部表情。经过训练的系统可用于分析来自任何扬声器的音频,并自动产生相应的口形,应用于自动语音动画的面部模型。与之前程序化的生成语音动画的研究相比,这套系统能直接从数据中学会自然的协同发音效果。与此同时,它需要调整的参数不多,可以实时运行,并与现有的动画重定向方法兼容。
迪士尼实验室表示,他们工作中的一个重点是开发出能高效生成语音动画、同时快速整合到现有产品中的方法。实际上,由于保持了细节的丰富和语音的准确性,这套系统的应用范围还可从动画扩展到 VR 社交,让 3D 化身更加生动。
谷歌推出仇恨犯罪新闻记录索引,预测「仇恨犯罪」
为了更好地解决仇恨犯罪这一问题,谷歌和 ProPublica(一个独立的非盈利新闻编辑部,为公众利益进行调查报道)联手推出了一个基于机器学习的工具——仇恨犯罪新闻记录索引(Documenting Hate News Index)。它通过对大量新闻文章的分析,建立起一个全国范围内的能预测仇恨犯罪发生地的预警图。
它从过去 6 个月的谷歌新闻文章中获取原始信息,再用 Google Cloud Natural Language API 来创造出一个可视化工具,帮助新闻报道者及时在全国范围内发现哪里正在有仇恨犯罪事件发生。这个工具提供的数据是在当年发生的持续更新的数据快照,这能为新闻报道者提供一个报道入手点,这对于新闻报道来说非常有价值。
这个工具汇集了那些与仇恨犯罪、偏见或虐待有关的新闻文章。这可能包括反犹太主义的涂鸦,或者有关法庭案件的信息的类似事件等等。另外,谷歌还计划对这个工具的新闻文章数据集进行监控,以确保不会出现像只提到「仇恨」一词的文章那样的错误新闻事件。用户可以通过这个工具按日期搜索,或使用关键字搜索与仇恨犯罪有关的新闻文章。它还通过算法来提供相关的关键词,比如罪犯的名字,犯罪发生地点,或者是仇恨犯罪的类别。为了确保新闻数据始终是最近更新的,这个工具会每天对数据库进行更新,并且相关事件可以追溯到当年的 2 月份。第三方开发人员可以通过 Google Trends Github 访问此工具。
当然,这个工具也不是 100% 地能对仇恨犯罪做出预测,它也有它的局限性。因为这个工具只是单独地基于新闻文章报道,而大多数的仇恨犯罪事件都没有被报道,因为那些犯罪人员并不总是想上新闻被曝光。坦白地说,目前这个工具还不是很有效地适用于达成预测仇恨犯罪的目标。
深度学习进入太空领域,用于寻找 NASA 月球登陆点
NASA 研究人员从卫星中收集的月球 3D 图像,总数据量已经达到了 200TB。如果以传统的技术,研究人员需要花费两个多星期的时间处理这些技术。目前,NASA 已经开始招募像英特尔这样的科技公司,去帮助它分析数据。
通过人工智能系统,研究人员能够顺利克服图像中阴影带来的困难,快速生成月球两极的地图,并详细定位出陨石坑的位置。全程花费的时间只需要两三个小时,准确率为 98.4%。拥有了这些数据结果,NASA 可以在月球上确定更好的着陆点,还能增加月球车的太阳能的接受量。
这项计划是 NASA 前沿发展实验室(FDL)的一部分。NASA 还想用人工智能技术解决更多的空间探索问题,比如空间资源分析和行星防御。
谷歌的一款新算法可批量清除图片水印
近日,谷歌研究院在博客中介绍了全新的 AI 去水印算法,研究的相关论文已经在 7 月底召开的 CVPR 上发表。由于目前大多数水印都是通过统一的方式批量添加,与原始图片存在一定的差别。研究人员正是从这一点出发,提出一种通用的多图抠图算法,输入带有水印的图片时,系统会自动判断前景水印和背景图像。目前,在较为简单的场景中,清除中心水印和全局水印的概率近 100%。但是当背景物多样、色彩复杂时,效果就开始打折了,只能做到淡化稀释。
谷歌表示,研究的目的不是为了破坏版权,一是工具本身无罪,二是从反面的角度也告诉版权方如何从反制去水印操作。实际上,研究人员还在论文中提出,水印的一致性是当前水印技术脆弱的罪魁祸首,如果将水印做出一些随机的调整,算法就很难将其清除。
观点
Max Tegmark:人工智能与物理学类似,解决的都是能被数学解释的问题
麻省理工学院的物理学家 Max Tegmark 认为,AI 系统之所以运作得如此顺利,也许是因为它们的构造利用了物理世界中的某些特殊性质。Tegmark 说:「AI 正是运用这些物理学原理解决了复杂问题。在某些方面,我们平时注意到的那些简单的物理原理和 AI 所运用的深层神经网络程序,是类似的」。这种特殊性质意味着神经网络解决的问题,只是一些特殊的数学问题,而且这类问题可被大大简化。不过,仍然有一些更困难的问题,需要神经网络加以解决。比如,在网络上保护信息所需的加密方案等,这些加密方式可能就像普通的噪音一样毫无规律可言。
在自然界,亚原子法则非常简单,但是,描述一只蜜蜂飞行的路线所需的等式却极为复杂,描述气体分子运动的等式更简单一些。Tegmark 说,目前我们还不清楚深度学习能否像描述气体分子的运动规律一样,描述出复杂的蜜蜂飞行路线。人生活在物理空间,但目前还无法完全用数学解释一个人的生活。Tegmark 称,「真实世界」的问题之所以具有某些特殊性,是因为真实世界本身就很特殊。
图说
阿里公布二季度财报,云业务成一颗闪亮明
8 月 17 日,阿里巴巴公布今年二季度业绩,再一次超出华尔街预期,其中部分是由于云业务保持强劲增长。财报显示,该季度内阿里云付费用户数量由前一季度的 87.4 万增长至 101.1 万,成为亚洲首家达到百万级用户规模的云计算公司。同时,该季度营收达到 24.31 亿元,预估年度收入将破 100 亿。
在人工智能产业化方面,阿里云推出的城市大脑、工业大脑、医疗大脑和环境大脑已经进入应用阶段。其中,城市大脑已经落地杭州、澳门、苏州和衢州。此外,阿里云的用户群体正在从中小企业和互联网公司向传统领域的制造业、金融业、国有大型企业等企业级市场迈进。
华尔街知名投资媒体 The Street 表示,阿里云是一颗真正的明星,「对亚马逊和微软来说,他们有了一个严肃的云计算对手。」