这周,是不平静的一周。当 DotA 玩家还惊讶于 OpenAI Bot 在单挑项目中完败人类顶级玩家时,欧洲再度传来让人震惊的消息。据报道,西班牙巴塞罗那周四(17 日)发生小货车冲撞人群事件,造成 13 人死亡,100 多人受伤。袭击发生几个小时后,极端组织「伊斯兰国」(ISIS)宣称对事件负责。
2017 以来,欧洲先后发生了好几起恐怖主义袭击。英国伦敦、曼彻斯特、瑞典斯德哥尔摩以及巴黎先后遇袭,西班牙遇袭是欧洲遭遇的一系列恐怖袭击中的最新一起。西班牙曾自诩「欧洲国家反恐的行动先锋和榜样」。这次袭击也是西班牙自 2004 年「3·11」事件以来遭遇的最严重的恐怖袭击。
如果大数据可以帮助我们找到合适的合作伙伴、优化酒店房间的选择和解决许多其它日常生活中的问题,那么它也应该能够通过预测致命冲突的未来爆发来拯救生命。对于冲突研究人员来说,这一愿景是政策影响和社会控制研究的终极前沿。
一、AI 距离冲突预测的圣杯,还很远
在阿西莫夫的《基地》系列科幻小说中,天才哈里·谢顿几乎完美地预测了银河帝国的衰落和之后相当长一段时间的发展。神经网络的兴起,可以帮助人类在更加广泛的领域,比如政治预测、社会事件预测乃至人类文明发展的预测上,实现同样的成就吗?
「恐怖袭击绝不是一时头脑发热的结果,而是由像你我一样有目标、并且努力想要付诸实施的人精心安排的结果。」毕业于西点军校、曾任美国军方情报分析人员的 Paulo Shakarian 认为。现在,他是美国亚利桑那州立大学计算机科学教授,也是将人工智能用于反恐研究的先行者。
2015 年,Paulo Shakarian 在 Mining for Causal Relationships: A Data-Driven Study of the Islamic State一文中尝试对曾被认为不可预测的反叛组织行为进行建模、预测。研究结果超越了相关性,检验了基于因果的时态关系。
研究人员分析了战争研究所提供的 2200 个 ISIS 相关事件的数据,构建了一个模拟 ISIS 行为的算法。这 2200 个事件发生于 2014 年下半年,既包括了围绕 ISIS 的军事行动,也包括反对 ISIS 的势力(包括伊拉克、叙利亚和美国领导的联盟)。在其中,他们将逻辑程序和因果推理相结合,试图挖掘出事件之间的因果关系。由此得出了 ISIS 的一些规律。
比如,如果在某个星期,ISIS 在伊拉克采取了步兵行动并伴有间接射击,那么,下一个星期在叙利亚就会出现车载简易爆炸装置(VBIED)的行动;叙利亚政府空袭之后的一个星期内,ISIS 往往会扣留大量人质。并且,在他们的数据库中,类似的大规模扣留总是发生在叙利亚空袭之后。
根据这些行为规律,他们得出了一些结论。比如,ISIS 可能会在除巴格达以外的其他区域采取大规模步兵行动之前,在巴格拉采取自杀式车载炸弹,来防止伊拉克军队/警察的增强部署;联军空袭与 ISIS 对简易爆炸装置的使用之间存在着关系,但却没有激发其他更大规模的武器(例如车载炸弹),这可能意味着 ISIS 在这种行动后,会依赖更加分散和反叛风格的策略,等等。
现在,时空范围更有限的预测——例如预测的一个给定的处于内战的城市的短期暴力轨迹——是完全可能的,Lars-Erik Cederman、Nils B. Weidmann 总结道。
神经网络的兴起推进了冲突预测研究。利用新的可用数据和改进过的模型,研究人员可以看清政治暴力的时空动态(temporal and spatial dynamics)情况。比如,使用新类型的预测器(predictor,主要是战争新闻报道)后,研究人员能够以远远更高的时间频率上扑捉到政治紧张,这些报道被证明是比传统结构变量(structural variables,如民主的水平)更强大的战争发生预测器。
但是,技术发展到今天,距离实现可以拯救生命的冲突预防(conflict prevention)还有很大距离。而且,这一领域还远远没有达到民意调查机构和经济预测机构所能接受的政策影响。
数据是一个很重要的抑制因素。与预测台球轨迹不同,测量冲突发生的时间、地点和时间要难很多,而且这些预测与相当大的不确定性相关。另外,由于现在使用的新型数据往往是从新闻文章这样的次要来源编码而来,因此,观察得到的高水平暴力结果,可能是实际暴力水平的反应,但也可能仅反应出新闻报道概率很高(或者两者都是)。这使得预测很困难。扩大数据集可能加剧这一问题,因为它同样依赖次级来源。
另一个很重要的(可能也是最重要的因素)是系统复杂性。与交通、台球、行星运行系统或大选系统不同,武装冲突系统包含着一组难以处理的施动因素(actors),而且这些因素以超出常规的方式交互着。因此,在缺乏了解这些互动机制,也没有足够用于测量相关变量的数据的情况下,我们能做到的仅仅是模式识别,而不是具体事件的经验预测。
最近,哥伦比亚大学统计学教授兼首席研究员 Shaw-Hwa Lo 提出了一种新的分析大数据的方法:「影响分」(I-Score)。由于很多变量可能不具有预测性,同时很多预测指标可能不具有统计学意义。为此,他们提供了一个理论框架,并据此设计了合适的预测方法。研究人员指出,这一方法的应用场景很多。例如,使用高维数据(如基因数据集)进行疾病预测、用于社会科学文本预测或金融市场预测以及恐怖主义、内战、选举预测等。
在政治暴力这个问题上,希望大数据通过某种无理论的「蛮力」产生某种有效的预测是错误的想法,Lars-Erik Cederman、Nils B. Weidmann 指出。自动数据提取算法,比如基于社交媒体的网页抓取和信号探测,可能会加剧政治紧张局势,但这并不意味着这些算法能以较高的时空精度预测低概率冲突事件。只有研究人员考虑到数据质量和代表性的局限性,大型自动编码的数据集才能发挥用处。
二、切断网络效应:AI 的三种运用策略
直接预测冲突的 AI 距离我们遥远,但是,我们可以将催生恐怖主义的因素扼杀在摇篮中。这是一种社会预防的犯罪学思维。社交媒体,成为恐怖主义与互联网公司的必争之地。
1、AI 监管极端社交媒体信息,但仍以人力为主。目前,有一种看法在欧洲和美国都越来越流行,那就是互联网公司在为伊斯兰圣战主义者帮忙。
以今年 6 月发生的伦敦恐怖袭击为例。三名恐怖分子都与极端主义传教士有联系,这些传教士在 YouTube 上拥有很高人气。其中一人还对澳洲一起青年恐怖袭击事件负有部分责任。三位恐怖分子中的一人还深受美国传教士、IS 招募者 Ahmad Musa Jibril 的视频影响。另外,伦敦恐怖袭击者可能还从极端主义网站上学会了作案手法,制定作案计划。根据以往经验,他们还会通过端到端的即使通信应用程序沟通。
正如当初让互联网公司为网络泛滥的侵权盗版承担一定义务,情报政客们都要求科技巨头对网络极端主义问题承担更多责任。在一定范围内,他们的要求是合理的。
与传统恐怖组织相比,IS 的哈里发更「与时俱进」,重视数字市场「广告营销」。IS 会使用主流数字平台搭建自己的社交网络,并「众筹」恐怖活动。宣传视频制作完毕,会有翻译、推广与社交媒体领袖以及创建链接的人一起将内容推广到网上。有一个叫 Upload Knights 的团队,在视频发布两天后,就散播了 136 个从谷歌接入的视频链接(69 个 YouTube,54 个 Google Drive,13 个谷歌图片)。
目前,科技巨头主要依靠传统的报告系统反恐。用户标记极端主义内容,公司检查后再确定是否删除。这种与早期打击侵权盗版方式一样的机制,不仅反应速度慢,而且花费不菲。扎克伯格近期表示,Facebook 将利用最新图像识别技术进行判断,被认定为与数据库中保存的恐怖活动相关图像和视频一致的内容将无法发布和分享。
然而,研发出这样的工具还需要好些年。一方面,数据不足意味着需要成熟的算法,需要专家去弥合数据与洞见之间的鸿沟。「人工智能并不能判断所有内容」。负责反恐问题的 Facebook 高管莫妮卡·比卡特指出。对于仅靠人工智能无法应对的内容,将由监管人员进行判断。
最近 1 年里,Facebook 增加了 150 多名反恐专家,并在全球追加 3000 名内容监管人员,合计达到 7500 人。谷歌也将大大增加 YouTube 的 Trusted Flagger 计划中独立专家的数量。在已有的 63 个组织基础上新增 50 个专家型非政府组织 (NGO),并为它们提供运营资助。扩大与反极端主义团体的合作,将有助于谷歌识别可能被用于煽动和招募极端分子的内容。但这也同时意味着增加了人类偏见带来的隐患。
另一方面,区分极端主义内容比识别儿童淫秽图片要难得多。难点主要在于要区分视频的语境。比如,「我们打算毁坏(destroy)你的办公室」,这种内容是合法的,但是「我们打算炸掉(bomb)你的办公室」就属于禁止内容,因为它更具体地建议了使用武器。机器很难区分这两种表达的不同。谷歌也投入了大量的机器学习工程资源,应用「内容分类器」,帮助更快识别和消除与与极端主义和与恐怖主义相关的内容。
2、AI 预测极端内容,仅仅是开始。既然恐怖分子善于利用病毒传播,在社交媒体上发布符合他们意识形态的信息。那么,我们是否能够预测哪些信息具有病毒信息的潜质,抢在他们之前发送难以反驳的反对信息呢?
Facebook 已经开始试用能理解语言的人工智能,辨别支持或助长恐怖行为的留言。不过,几年前,Shakarian 教授已经开始研究这些问题。他和同事们用 WISE(Web 信息系统工程国际会议)2012 年挑战赛所提供的新浪微博数据库,找到了一套可以预测信息「病毒性」的参数。研究的基础是「结构多样性」(structural diversity),指的是某一个人所涉入的社交语境的数量,通常可以表示为周边区域内独立社区的数量。经测试,这套方法的准确性达到 0.69。
不过,研究人员并不满足于此。正如企业往往希望找到那些阻止广告信息蔓延的人,分析他们的特点并对其采取不同的市场策略。研究人员希望找到遏制恐怖意识形态蔓延的「防火墙」。他们在英国、伊拉克、叙利亚等国家的社交媒体进行数据挖掘,试图理解哪些因素能「抑制」社交媒体上的病毒模因(viral meme)。
研究如何预防人们加入极端组织——这非常重要,也是一个长期目标,Shakarian 教授说。
目前,谷歌和 Jigsaw 公司合作,在欧洲实施「重定向」方法,对那些在谷歌和 YouTube 上搜索极端主义资料的用户,定向投放反恐怖主义视频以阻止其加入。微软正在利用 Bing 尝试类似的研发工作。去年,谷歌、Facebook、推特和微软同意协作建立一个使用独特标识符标记的恐怖主义内容的数据集。其他公司可以识别标记内容并从他们的平台中移除。但是,这个数据集目前仅处于早期,数据材料也非常糟糕。
最近,Facebook 也引进了使被禁用 Facebook 的恐怖分子在利用假名开设新账号时,能够根据其交友关系和发布内容及时发现的新技术。
3、「形塑(shaping)」行动。理解恐怖分子的网络及其结构,有助于制定更好的目标打击计划。详言之,为了瓦解恐怖组织和反叛网络,国家安全机构通常倾向于定点打击「高价值目标」(HVT),也就是他们的首领。然而,有无数的例子证明,首领被击毙后,反叛网络很快就会再生成一位新的首领。如果可以预测到未来新生首领提前予以清除,会大大提高反恐活动的效果。
人工智能最重要的优势在于,能对恐怖分子、犯罪分子和极端分子建立更好的模型。人类要花几个星期时间才能完成一张包含几十个犯罪分子的社交网络,从中理解他们的组织结构。处理几百万人的社交网络,软件只需几分钟。Paulo Shakarian 设计了一套算法,可以识别出社交网节点(也就是小头目)。清楚这些种子选手后再击毙首领,恐怖组织很难再东山再起。
三、其他渠道的零星应用
AI 在反恐场景下的应用,多散见于其他领域,主要以预防手段为主。
比如,切断恐怖主义活动的资金来源。长期以来,银行一直在使用传统反洗钱系统来标记可疑活动,但是,这套系统并不适合追踪恐怖活动的资金转移。虽然银行开始依赖于硬编码的「if-then」规则预测可疑行为,比如如果该软件发现了从迈阿密到波哥大的七位数资金转移,它就会识别出来并标记这笔转账。但是,一个藏匿着的恐怖分子进行的小额交易可能不会被常规反洗钱系统检测到。除非这些系统使用人工智能技术。
一家位于宾夕法尼亚州的公司 QuantaVerse 正在尝试利用新技术解决这一矛盾。它们采用机器学习的技术,通过大量的银行数据训练,可以及时发现异常的账户和潜在的可疑交易。传统的反洗钱系统可以监测 90 天的数据,而 QuantaVerse 的监测时长可以延至两到三年。这是一种海底捞针一样的外科手术式方法。据报道,该技术已经帮助找到了一个被美国缉毒局称为「世界最大的毒品洗钱人之一」的巴拿马人。
不过,这个行业的机器学习应用还处于早期阶段,即使是 QuantaVerse 也不确定他们掌握的线索中有多少已经变成了实实在在的威胁。
在生物识别方面,也有一些出乎意料的应用。「根据社会和生命科学,个性被基因影响;我们的面部是 DNA 的映射。」一家以色列初创公司Faception 宣称,扫一眼人脸就鉴别出人眼所发现不了的性格特征。这家公司建立了 15 个不同的分类器,据说,对特定人格特征具有高达 80% 的评估准确率。这些分类器可对视频流、相机和线上及线下数据库中的脸部图进行编码,「将个体与各种人格特征和类型进行匹配,准确率非常高。」公司介绍说。
据英国《每日邮报》报道,该公司表示已经成功识别了巴黎恐怖袭击的 9 名恐怖分子。Faception 还表示,其技术能在盲测中准确对扑克和非扑克玩家进行分类,在 27 张人脸图像中分辨出 25 个扑克玩家。公司已与某国土安全机构签下合约,帮助识别恐怖分子。
「我总不能看一眼你的脸,然后预测说你是个杀人犯,就逮捕你吧?你可以从中看出这是多么地有争议性。」华盛顿大学计算机科学教授 Pedro Domingos 不禁质疑道。不过,这并没有阻止面部识别技术被官方应用在反恐活动中。2015年9月,澳大利亚政府将面部识别列入反恐策略,旨在「将恐怖分子、杀人犯和武装劫匪及其他罪犯的姓名与面部对应起来。」《先驱太阳报》也曾报道澳洲的维州将运用尖端面部识别技术打击恐怖主义行为。
在争议协商方面,Integral Mind 的 CEO Daniel Osher 推出了 cogSolv , 一款基于 Mind map 的人工智能系统。这套系统能够理解来自其他团队成员的世界观,模拟他们的反应,并将这些与真实世界的知识结合起来,说服对方或者获得双赢局面。实际上,也提供了一个避免极端纷争,实现和平决策的工具。
早在 2012 年,Shakarian 教授就曾开发过 SCARE(Spatio-Cultural 诱导推理引擎),帮助定位反叛军武器库的软件,让士兵洞察出叛军的武器可能藏在什么地方,阻止他们的路边炸弹攻击计划。其修改版 C-SCARE/A 软件专门用在了阿富汗战场上。但是,未来恐怖主义会改变战场,Shakarian说,最重要的活动领域将是网络空间。一些恐怖团伙已经开始使用黑客技术了,现在仅仅只是一个开始。
不过,将 AI 有效用于反恐,现在也才开始。