外媒质疑美国安局天网,或已误杀千人
外媒质疑美国安局天网,或已误杀千人
2016-02-22 15:10:25 来源:51CTO抢沙发
2016-02-22 15:10:25 来源:51CTO
摘要:我们曾报道过美国国安局NSA一项名为“天网”SKYNET的计划,根据The Intercept公布了一份文档显示,“天网”使用机器学习算法分析帮助NSA寻找潜在恐怖分子。
关键词:
网络安全
解密“天网”为何疏而有漏
SKYNET的分类算法对元数据与基础事实进行分析,然后为每个人进行打分。理论上真正的恐怖分子会得到高分。
想要训练出这样的机器学习算法就像训练Bayesian垃圾邮件过滤器一样:你要给它“喂食”已知的垃圾邮件和非垃圾邮件。从这些最为基本的“真理”中,算法便会掌握怎样才能正确过滤垃圾邮件。
同理,“天网”项目中最为关键的部分便是算法的训练,而为数不多“已知恐怖分子”造成的局限性就显现出来。
小编从华盛顿大学Data Lab数据学研究者CHI那里了解到,NSA在“天网”中采用的随机森林算法在机器学习中很常用,而且一般来说效果也很好的,但是在用于发现恐怖分子时还存在诸多问题。
百科:随机森林算法
随机森林算法是采用用随机的方式建立一个有很多不相关决策树的森林,在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类,然后看看哪一类被选择最多,就预测这个样本为那一类。
Ball解释道“天网”算法是通过10万随机挑选的个体和已知的7名恐怖分子进行训练。NSA给算法提供6名恐怖分子,让它找出第7个。
安全专家Bruce Schneier认为政府在使用大数据时不同于其他情况:
“如果谷歌犯了个错误,人们最多是看到一辆汽车的广告而并不会想要购买。可如果政府犯了个错,可能会伤及无辜人的性命。”
在NSA的测试中甚至出现了0.18%的错误率,这就意味着在5500万样本中将近9.9万人进行了错误标记,而Ars暗示这一结果可能导致NSA对目标发起无人机轰炸。
科技之光,还是科技之殇?
算法已经开始统治我们的生活,用“天网”寻找恐怖分子这仅仅是个开始,采用相同逻辑寻找“毒贩”、“抗议者”或“异见人士”的手段可能不久之后或已经出现了。基于元数据的“杀人游戏”此刻就在进行着,而千里之外的我们对此视而不见。倘若有天,“天网”认定了你是恐怖分子,那时你该怎么办?
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。