Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

洪舒越校对王菁 编辑

那些令人细思恐极的AI技术,哪一个戳中你的命门?

谈到人工智能,有人会觉得它的出现会造福全人类,例如Facebook的CEO马克·扎克伯格。当然,也有人持反面观点,例如伊隆·马斯克、史蒂芬·霍金,他们认为人工智能发展到某种程度后,可能就会像好莱坞大片里的剧情一样,威胁全人类。

那些持反面观点的人,到底在怕什么?有证据么?今天,我们盘点一期那些让人细思恐极的AI技术,来看看人工智能是否值得引起人类足够的担忧。

一、摄像头监控情绪,鉴别罪犯和性取向

近年来得益于深度学习的迅速发展,人脸识别领域取得了重大进展。开发者可以基于神经网络让机器模拟出人类大脑的学习过程,并通过卷积神经网络模型和海量的图片数据进行训练,使生物识别从以前70%、80%的准确率提升至近几年的99.6%甚至99.7%,具备商用条件。

于是,“刷脸”成为了热词,人脸识别技术不断进入大众视野,在人们衣食住行的各个领域发力,迎来运用的“井喷期”,其中,金融和安防等行业成为应用“先锋”领域。随着人脸识别技术的商用场景不断扩充,市场潜力巨大,资本嗅到商机纷纷涌入。

但随着人脸识别技术的不断成熟与普及,这项技术也逐渐让人觉得细思恐极。

首先,人脸特征与指纹、虹膜相比,是一个具有弱隐私的生物特征。例如,很多人都会发自拍照,也是相对公开的特征。如何保证用户数据安全尤为关键。

据媒体报道,在一个名为“你的脸就是大数据”的项目中,俄罗斯摄影师叶戈尔·茨韦特科夫在圣彼得堡用了6周时间拍摄100名地铁乘客的人脸照片,之后利用人脸识别工具比对俄罗斯最大社交网站VK(VKontakte)上的5500万用户,找到了大约70名乘客的个人资料。

因此,在如今公共场合遍布摄像头、各种手机APP具备人脸识别功能的环境中,如何确保收集用户数据的部门和企业有效保障数据安全是非常令人担忧的事情。

其次,人脸识别技术存在滥用现象。如果说在大街小巷安装摄像头、在火车站机场采用人脸识别技术是出于公共安全考虑,那么在学校课堂采用人脸监控则引发大家的不适情绪了。

据媒体报道,杭州某中学将一款名为“智慧课堂行为管理系统”的科技应用于课堂教学。该系统在学生上课起立时,几秒钟便可完成点名,用刷脸代替传统意义上的口头点名和刷卡。此外,该系统每隔30秒会进行一次扫描,针对学生们阅读、举手、书写、起立、听讲、趴桌子等6种行为,再结合面部表情是高兴、伤心,还是愤怒、反感,分析出学生们在课堂上的状态。

该消息一经报道,立刻引起网络争议。支持者认为,这种行为没有问题,毕竟一切是为了孩子的前途。反对者则认为,科技是用来服务人的,而不是监视人的。对学生上课行为实施全程监控,侵犯了学生隐私,增加了学生的压力,况且用同一个标准监视学生对学生来说也不公平。

或许,总会有一些家长们在面对孩子学习情况时变身虎爸虎妈严苛无比,但当他们自身经历被无处不在的摄像头监控并识别情绪、分析心理活动时,就另当别论了。此前百度宣布要推出一款基于人脸识别的社交软件,能够帮助恋爱小白识别对象的情绪,从而做出相应举动。如果这项功能真的很成熟,这恐怕并非有助于恋爱,而是让人感到害怕了。试想一下,甲方爸爸教你学做人,你面带微笑洗耳恭听,这时对方拿出摄像头企图判断你是否正在腹诽;你成为被告站在法庭上为自己辩护,来自各个方向的大大小小的摄像头对准你,记录你每一个细微表情,分析你是否撒谎;或者中美贸易代表团谈判时,双方都拿出摄像头来试探对方底线……这将是一个“老大哥正在看着你”的世界,人人企图窥探别人内心,人人也害怕被窥探到真实情绪。

除了AI技术识别情绪令人害怕,其他遭人非议的还有鉴定性取向、识别罪犯、政治倾向等。这种除了涉及到严重侵犯个人隐私权的问题,还有可能由于算法存在偏见导致鉴定结果出现偏差。如果将这种不加修正和制约的AI技术作为参考依据,将会为全球因意识形态、宗教信仰不同所造成的摩擦斗争火上浇油。

二、麦克风偷听用户讲话、监听手机打字

“我的命,我自己操盘”,这是《窃听风云2》中的经典台词,但现实生活中,我们可能连自己手机的麦克风都操盘不了。

你遇到过这样的情况吗?刚说了想吃什么,手机里就蹦出了它的推荐;刚说了要买什么,就出现了精准推送的广告。由于有多名用户反映类似情况,有记者专门耗时3个多月,通过模拟用户使用场景,对安卓手机、苹果手机、苹果平板电脑上的饿了么和美团外卖进行多轮测试。从测试情况来看,在随后数分钟到数小时的时间里,出现相关推荐的概率高达60%-70%。

尽管饿了么和美团均否认“监听用户日常对话并做信息分析”,目前也没有任何证据能够证明APP通过麦克风偷听用户讲话,不过亚马逊智能音箱Echo被爆“偷听”用户对话已是证据确凿。

除了此前有Echo偷听用户谈话,并将谈话内容发给其他联系人的新闻传出,最近亚马逊还被彭博社爆出拥有千人监听团队,他们人工听取和检查用户和智能语音助手Alexa的私人对话,目的是帮助Alexa改进语音识别技术。报道称,有时候,参与其中的工作人员会听到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助。还有两名员工甚至称,他们听到过他们认为是性侵案的声音。当这种事情发生时,他们会在内部聊天室说出来解压。

尽管亚马逊发言人辩解他们只会注释极小一部分的Alexa录音样本,帮助训练语音识别自然语言理解系统的信息,目的是为了改善用户体验,“我们有严格的技术和操作保障,对滥用我们系统的行为采取零容忍政策。员工在工作流程中无法直接访问能辨别用户和账号的信息。我们使用多重验证来限制访问,对服务加密,审计我们的工作环境,以对所有信息高度保密。”

亚马逊在其宣传和隐私政策的材料中,没有明确表明Alexa获取的一些对话录音是人工来听,只是在常见问题解答列表中提到了一句“我们使用您对Alexa的命令来训练我们的语音识别自然语言理解系统”。Alexa的隐私设置中,公司给用户提供了禁用录音开发新功能的选项。彭博社看到的截图显示,发送给工作人员的Alexa录音没有提供用户的全名和地址,但与用户的账户号、名称和设备序列号相关联。

除了Alexa,依赖人类员工填补算法空白的,还有谷歌、Siri。早在 2014 年,谷歌 Chrome 浏览器就被曝出其语音识别功能存在漏洞,或将致使用户的电脑麦克风长期被黑客监听。即使不是被黑客监听,Chrome 也一直被很多人质疑通过麦克风窃听用户谈话,并通过谈话内容向用户推荐相应的广告。

由此可见,那些需要进行训练语音识别自然语言理解系统的软/硬件都存在窃听的可能,麦克风的安全隐患并不比摄像头所带来的小。并且,随着科技的进步,这种窃听行为已达到细思恐极的地步。

不久前,媒体报道剑桥大学的一个科研团队通过手机的内置麦克风,搭配AI算法,就能让输入的每一个字处于监听状态,哪怕是触摸屏手机。

和大众所了解的常识不同,事实上,即使是在触摸屏上轻悄悄地操作,手指的每一次轻微的敲击都会产生声波。当戳击屏幕不同位置时,声波信息也会有相应的变化,这些信息恰巧可以被手机内置的麦克风捕捉到。于是研究人员利用这个特点,开发了一个手机恶意应用程序,当这个程序被植入手机时,能够调动内置麦克风,让其秘密开始工作,记录下触摸时的声波信息。随后,科学家们收集了声波形状与触摸位置的对应信息,训练出了一个AI模型,还原输入内容。至此,作案流程已经基本成型:恶意程序悄悄启动→悄悄捕捉输入密码时的声波→AI模型预测手指对应在屏幕的位置→还原输入的密码和信息。

AI伙同麦克风,分工明确,里应外合,井然有序地就能将你的隐私偷走。并且,随着科学进一步研究,目前能够具备监听功能的远不只是麦克风。

例如利用硬盘监听。硬盘工作的时候,主轴高速运转带动盘片,上面的磁头会感应盘片上的磁场变化,通过改变磁场,来写入数据。这个过程非常精细。只要受到外部的声波冲击,磁头就会发生偏移。硬盘的位置传感器,产生的电压信号里就会体现出这个偏移。然后,科学家会利用AI来分析这个细小的偏移,以此还原人类说的话。此外,科学家还认为薯片包装袋、铝箔、水杯甚至盆栽植物,只要能受到声波干扰的物体,便能变成监听工具。尽管这些方法尚在研究阶段,但也足以让人担心。

三、智能机器人骚扰电话+大数据营销+探针盒子非法获取用户隐私

在今年的315晚会上,央视曝光了“机器人拨打骚扰电话+逃避监管的特殊方法+恶意收集的隐私大数据”的一条龙产业,情况令人触目惊心。

晚会报道称,目前,屡禁不绝的骚扰电话部分是由机器人在拨打,而这类外呼机器人仅花费3000元就能从一些高科技企业那买到。相较于人工一天最多拨出三五百个电话,机器人可以不休不眠地打电话,一天能打出几千个。例如被央视曝光的某企业负责人就承认,他们公司机器人在一年多时间里拨打出去的骚扰电话已经超过40亿。

AI电话机器人的工作原理很简单,就是将原始声波转为文字,然后电脑通过关键词自动识别语义,在话术库中匹配到话术,然后播放出来。每套系统均被设定有总流程,一旦总流程走完,机器人将自动挂断电话。目前,市场上常见电话机器人的总流程大致可分为介绍服务、信息问询、索取联系方式三个部分。由于基本话术有限,所以机器人不可能解答出所有被提问到的问题。对于机器人未能回答的问题,会被系统按照序号记录下来,当把对这些问题的解答录音导入系统后,机器人再被问到相同问题就可以答复出来。

此外,AI电话机器人还可以在一定程度上识别人类声音,迅速做出判断,按照剧本引导用户进行对应操作,并借助大数据识别过滤能力,筛选出更精准的目标用户,这意味着AI电话呼叫有可能会朝着越来越垂直的方向发展。目前,AI电话营销机器人备受贷款、股票行业的青睐。

至于为何这种电销公司如此猖狂、难以查封,则是因为一些机器人研发公司通过一种“硬件透传”的方法将骚扰电话的记录彻底隐藏,让监管部门也无据可查。

用机器人拨打骚扰电话,加上逃避监管的特殊方法,一些外呼公司的外呼量大幅增加,那如何获取更多号码资源呢?

央视揭露,目前市场上存在一类名为“探针盒子”的产品,大小同充电宝一般。当用户手机无线局域网处于打开状态时,会向周围发出寻找WiFi的信号,“探针盒子”发现这个信号后,就能迅速识别出用户手机的MAC地址。盒子采集到手机里面的MAC地址,自动转换成IMEI号,再转换成手机号码。

搜集附近用户手机号码、拨打骚扰电话只是探针盒子的功能之一,3·15晚会上还曝光了不少科技公司推出的类似产品。例如璧合科技的招财喵、智子信息科技的智子盒子,不仅可以收集用户手机号码,甚至可以对用户进行精准画像,曝光的个人信息包括性别、年龄、婚姻状况、学历甚至于薪资。一些公司将这种产品放在商场、超市、便利店、写字楼等地,在用户毫不知情的情况下,搜集个人信息。

至于这些盒子背后的大数据,主要来源于用户手机上所安装的一些软件。通常,我们在安装一个APP时,第一步跳出的是用户服务条例。如果需要安装这个APP,必须得点击同意这个服务条例才能安装。随后,APP会要求开通权限,例如是否允许访问通讯录、手机文件夹、访问麦克风、摄像头等。在你点击允许之后,当你使用APP时候会产生用户数据,而这些数据可以用作商业营销用途。

为了能正常使用App,用户只能同意被获取个人号码等信息,然而在用户不知情的情况下,这些个人信息却变成了一些企业的牟利工具,被房地产、贷款、教育培训等第三方公司,用作拨打骚扰电话等商业营销用途。

通过盘点我们发现,那些让人细思恐极的AI技术,最令人害怕的地方都在于隐私泄露而大家毫不知情(万分庆幸AI军事化被联名抵制)。我们生活在一个安全感和信任感逐渐崩塌的时代,除了对衣食住行的安全需求,在这个信息化时代,个人信息的泄露同样让人失去安全感。

李彦宏曾在某论坛上表示中国人对隐私问题没那么敏感,很多情况下愿意用隐私交换便捷性。这句话之所以引起众人愤慨,是因为得了便宜还卖乖。事实上,用户们在互联网上“裸奔”全都是出于无奈。因为几乎所有的互联网应用都在尽可能地搜集你的信息、你的社交圈、你的消费习惯、你的个人爱好,而且明里暗里的重重技术门槛,让你防不胜防甚至防也没用。除非不使用互联网,否则你的信息和隐私就无处隐藏。

科技的进步不应该让隐私保护成为空谈,除了相关法律法规的完善,或许,我们还可以从欧美科技巨头的做法中得到启示。此前谷歌宣布解散仅成立十天的AI道德委员会,引发业界轰动。谷歌解散委员会是因为其中的部分成员的身份、个人主张引发争议,不少人工智能专家表示反对,同时谷歌员工也开始以联名信的形式要求剔除该成员。于是谷歌公司宣布在目前的环境中,人工智能道德委员会无法按照他们想要的方式运作。所以,决定暂时关闭委员会从头再来。

从此次事件可以看出,舆论承担着监督的作用,强大到不可想象。如果我们每个人都如此一般注重个人权益,注重科技发展是否遵循伦理道德,抗议科技巨头无所顾忌地收集使用个人数据,抗议隐私泄露所造成的负面影响,即使目前科技发展的法律法规和伦理道德规范难以制定完善,也能消除“李彦宏们”的刻板印象,并让他们投鼠忌器了。

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

产业人脸识别语音识别智能机器人
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
暂无评论
暂无评论~