编者注:本文作者Holland Michel是巴德学院无人机研究中心的负责人。
2008年春的某一天,John Montgomery上校走进内华达州克里奇空军基地的一个地面控制站,像往常一样,通过无人机观察伊拉克地区的地面情况。当天的任务是对地处巴格达东北部、人口密集的萨德尔城进行公开巡逻。Montgomery的中队几周以来一直在观察该地区的情况。
Montgomery刚坐下,他的传感器操作员就转头和他说:“我感觉今天不太对劲儿,虽然我还不知到底问题出在哪里,但就是感觉不对。”Montgomery也有同样的感觉,他说:“整个城市呈现出的氛围和往常很不一样。我的中队在这里观察了很长时间,对萨德尔城的每一条街道都很熟悉,了解他们每天生活的节奏,连当地妇女从她们的阳台走到洗衣房的路线都很熟悉,当天大家都明显感觉到了有些不对劲儿。”
操作无人机飞行15分钟后,传感器操作员指着屏幕上的一名男子说:“这个穿着西装正在打电话的家伙看上去好像很正常,但我的直觉告诉我他可能有问题。”尽管无人机是在1.5万英尺上的高空飞行,但Montgomery相信他的直觉,他丰富的经验和经过训练的眼睛,不会让他随随便便就指出目标,于是他决定放弃原本计划中的整体巡逻,而是把该名男子作为重点观察目标。
无人机“捕食者”已经飞行了逾三个小时,该名男子并没有进入任何建筑物,他似乎漫无目的地走着,有时走进繁忙的公路中间,但他一直把手机放在耳边。
最终,这名男子走进了一条安静的小巷,一辆带货架的丰田皮卡和另外三名男子出现,他们四个人一起从卡车的车架中取出一个迫击炮,向附近的美国基地开火了两次,之后找到一个废弃的地方倾倒枪筒,之后那三名男子上了丰田皮卡车扬长离去,而西装男人则继续走路,似乎什么也没发生过。
一支情报小组接到命令跟住那辆丰田车,另一支队伍则穿过街区拿回迫击炮。无人机“捕食者”继续追踪那名穿着西装的男子,他在几个街区外的一所房子里消失了。Montgomery说他在那里和制造商见了面。
人们早就知道,五角大楼的无人机产生的数据远远超过其人员所能观察到的数据。如果不是政府庞大的间谍工具,例如像案例中描述的这个可疑男子就很难被发现,所以当前自动化图像分析被广泛视为是此类问题的解决方案。可以肯定的是,即使一个简单的计算机视觉系统也可以跟踪可疑人员,为操作员节省宝贵的时间和资源。但是,一个自动跟踪器是无法判断他是否有问题。这是一种建立在丰富的经验和直觉基础上,通过微妙的线索进行的生死攸关的判断。那计算机真的无法做到这一点吗?
当计算机说“这个城市不太对劲”
自那次任务过去十一年后,五角大楼进行了大规模的研究,曾经觉得不可能的幻想,现在已经快要实现。2017年初,在政府投入数百万美元用于实验室模拟实验后,五角大楼的一个实验工作组得出结论:当前的监控分析算法“已经接近人脑工作水平”。作为回应,国防部启动了广为人知的“Project Maven”,计划将当前的算法技术应用到实战中去。
“Project Maven”的第一个实验也被称作基于算法的多功能作战队伍(Algorithmic Warfare Cross-Functional Team),该系统能识别目标和发现无人机录像中的可疑活动,这些数据将传给10个负责执行叙利亚、伊拉克和一些非洲地区任务的情报部门。据一位高官透露,目前也已经扩展到别的地区。
通过该软件系统,分析师可以选择目标对象,汇集每个现有的所有无人机镜头剪辑视频,显示与目标对象相同的车辆或个人。还有很多其他的功能,包括进行分类。项目承包商之一,计算机视觉创企Clarifai,提供了能够在视频和图像中分析个人“年龄、性别和文化外观”的软件。
在第二次研究“冲刺”中,“Project Maven”将重点转向广域运动图像,即WAMI,它能以高分辨率的水平监测相当于一整个城市大小的区域。到2018年底,该计划为Gorgon Stare植入了一个“基于AI的”分析算法,Gorgon Stare是已知最强大的WAMI。
“基于AI的”的Gorgon Stare让人难以想象,保守估计,该摄像系统可同时记录数千人与车辆,一旦实现自动化,每个目标都能被聚焦观察。目前空军方面拒绝告知该系统究竟能实现哪些功能,但在2017年10月向澳大利亚皇家空军成员发表演讲时,该计划的负责人表示,该软件的早期原型能够即时识别汽车、卡车、人员和船只,未来还能完成更复杂的任务,也许有一天它真的能传达出“感觉不太对劲”的信息。
该计划由美国国家实验室和美国情报界的17个成员组织组成。“Project Maven”将实现人工智能监控新时代的大门,将万物众收眼底。
即时学习
该技术早期应用的主要问题是,即使最先进的系统也会故障,所以很难完全信任机器结果。但这种错误正在减少,很大程度上得益于机器学习的最新进展。在自动化的间谍式监控领域,这些学习训练量都十分庞大。麻省理工学院林肯实验室开发了一个包含1400万个注释图像的训练数据库,用于WAMI分析系统的数据训练,经过训练后,误报率几乎降为零。有人会说,即使是一个拥有广泛“训练”的系统,也永远无法超越人类,因为即使是一个经验浅薄的分析师在将一辆消防车误认为是装甲战车后,都能够及时改正,而计算机则会一遍又一遍地犯同样的错误。
目前,“主动学习”的机制得以解决这一问题。“Project Maven”中,系统一旦错误识别对象或活动,分析师可以点击“AI训练”按钮,算法将记住不要再犯同样的错误。同样的,当计算正确时,分析师会肯定它。通过这种方式,计算机可以随着时间的推移建立对有效和无效的理解,系统运行时间越长,工作效果就越好。
最终,这种软件甚至能够动态学习新的技巧。例如,使用“Project Maven”软件的分析师可以教会系统识别它们从未受过训练的全新智能形式。在一个示例中,分析师就教该软件通过消防车和救护车的出现来识别这是一个“紧急情况”的迹象。
当前,即使是那些怀疑论者们也很难否认这些进步让我们感到非常不安,因为现在是计算机而不是人类看着我们说:“这个城市有些不对劲儿。“
前空军无人驾驶飞行员Montgomery上校一直认为在此类行动中,人类的参与是十分必要的,但现在他已经不那么肯定了。他说看了YouTube视频,一个能主动学习的机器人在进行打杯子的游戏,起初,机器人是幼儿水平;但在第70次尝试时,球击中了杯子的边缘,它就像一位聪明的训练分析师一样开始学习修正,每次尝试都变得更好,最终在第100次尝试时,全中。
Montgomery说:“而且在那次后,它不会再错过目标。”
硅谷加入了战斗
开发出可以取代人工的智能技术,硅谷企业功不可没,他们从国防和情报领域挖掘出了大量技术人才。由劳伦斯利弗莫尔国家实验室开发的一个自动化分析程序Persistics于2014年关闭,因为其大部分团队成员都跳槽去了谷歌、YouTube和Facebook以及此类公司。
硅谷在商业领域的成就大部分都归功于它在情报领域的研究成果。通过YouTube精美有效的视频推荐侧边栏,可以预测搜索Huey直升机视频的用户,可能也会对有关核潜艇或Apocalypse Now的剪辑视频感兴趣。它使用了一种称为聚类分析的预测技术,同时这种技术也可以类似地用于预测漫无目地走动的人可能正在准备发动某种攻击。
五角大楼希望将这些思想和技术纳入进来,尽管有人持不同意见,硅谷的领导层最终表示他们愿意合作。在2018年3月,五角大楼聘请谷歌参与“Project Maven”项目,当时媒体舆论议论纷纷,作为回应,谷歌表示该技术仅用于“非攻击性”活动。但即便如此,逾3000名Alphabet员工签署了一份请愿书,要求公司撤销合作,此后不久合作便结束了。
当时,很多人都对这次政府与公司的合作感到震惊,但其实类似的合作早就不是第一次了。早在2013年,谷歌就与空军研究实验室签署了一份未向外披露的合作研发协议,专注于空中监视等数据处理技术的研发。作为合作的结果,空军工程师开发了一个网页,由国防部长办公室发布,被称作“革命性”的广域监控录像中自动“生活模式”分析原型。
无论从什么角度来看,这都不是所谓的“非攻击性”技术成果。生活模式分析可以详细研究个人日常活动,这是空袭前不可或缺的一步。
在“Project Maven”的争议之后,至少目前谷歌领导层似乎确实暂缓了之前的计划,退出了五角大楼云计算项目。但很多其他迹象都表明谷歌在国防领域的参与比我们想象的要广泛得多。在2019年的预算请求中,特别行动司令部还指出,需要450万美元购买大量云计算服务,包括TensorFlow,用于“大数据分析”项目。而空军发言人对AFRL-Google CRADA是否是谷歌参与空军项目的唯一案例,并没有给出明确回答,只说“将继续与行业和学术界合作,寻求新兴的技术。”
尽管谷歌放缓了步伐,但其他公司并没有。亚马逊的首席执行官贝佐斯和微软的Brad Smith都表示会继续参与JEDI竞标,包括DOD技术革命和一些其他的活动。
展望硅谷为我们带来的未来:可以在智能手机上订购书籍,然后只需轻轻一按,就可以访问数千小时的直升机和潜艇视频,在某个地方,人工智能计算机已经判断你想要观看此类内容。科技界与国防、情报界的关系日益密切。这样的未来让人感到心头一紧。你想,当你看到一个头条,写的是“此应用可以识别你远足中遇到的小动物”或者“使用谷歌人工智能找到你的艺术之魂”,但另一方面,所有的这些都可以被用于让监控更加自动化,更具洞察力,变得不可思议甚至接近“全知状态”。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。