利用大数据侦破波士顿爆炸案
波士顿马拉松赛的爆炸案发生后,波士顿警察局顶住压力,快速将嫌犯抓获,这背后支撑的科技力量有哪些,你想知道吗?这其中有哪些可以供我们借鉴?
2013年4月,不太平的世界使得奇怪的气候变得不值一提,当地时间4月15日下午2点49分,波士顿马拉松赛的爆炸案不仅造成了3人死亡(其中有一名中国人),150人受伤的惨案,更重要的,它将 911事件后,美国人好不容易修复的脆弱心理又打到了谷底。如何破案,特别是如何快速破案是摆在波士顿警察局以及美国联邦调查局(FBI)面前的巨大挑战。
事实上,波士顿警察局顶住了巨大的压力,在3天后的4月18日,公布了嫌犯焦哈尔·萨纳耶夫的名字,并发布了他的相片;19日凌晨发现嫌犯在水镇(Watertown),并包围了水镇;19日上午10点公布了嫌犯的车牌号,晚上8:45在一艘小船里将嫌犯捕获。一个全球关注的事件得以安全告一段落。
当然在这个事件的整个过程中,我最关注的事情还是和大数据有关的crowdsourcing,中文翻译为,“众包”。这个词来自2006年Wired杂志的一篇著名文章《众包的崛起》(The Rise of Crowdsourcing),意思和外包相似,只是众包的分包对象更广,并且几乎完全(只能)通过互联网连接,与此同时,几乎无法预估任务完成的时间与质量(因为无法预估有多少人接受分包)。
在波士顿爆炸案的破案过程中,FBI使用了众包的手段:
一、保留Copley广场附近的所有监控录像以供比对、查找,波士顿警察局的官员称“将仔细查看所有录像的每一帧画面”。
二、走访事发地点附近12个街区的居民,收集可能存在的各种私人录像,照片,无论他们来自摄像机还是私人的手机。
三、大量收集网上信息,包括像Twitter、Facebook、Vine、Youtube等社交媒体上出现的相关照片和录像等。
四、向公众提出了收集相关信息的请求。
这样一个似乎非常公开的案件的侦察及侦破工作使用了各种高科技的手段,充满了大数据的味道,无形中符合了大家对大数据理解中著名的4V原则:
一、Volume(数据量):来自各方的数据量是非常大的。
二、Variety(数据种类):各种数据源,特别是来自各种社交媒体上的图像、影像类的非结构化数据非常丰富。
三、Velocity(速度):在事件发生数分钟之内,已经有大量信息发布在各种社交媒体上。另外对这样高曝光度的社会事件的侦破,速度本身就是最重要的。
2013年4月,不太平的世界使得奇怪的气候变得不值一提,当地时间4月15日下午2点49分,波士顿马拉松赛的爆炸案不仅造成了3人死亡(其中有一名中国人),150人受伤的惨案,更重要的,它将 911事件后,美国人好不容易修复的脆弱心理又打到了谷底。如何破案,特别是如何快速破案是摆在波士顿警察局以及美国联邦调查局(FBI)面前的巨大挑战。
事实上,波士顿警察局顶住了巨大的压力,在3天后的4月18日,公布了嫌犯焦哈尔·萨纳耶夫的名字,并发布了他的相片;19日凌晨发现嫌犯在水镇(Watertown),并包围了水镇;19日上午10点公布了嫌犯的车牌号,晚上8:45在一艘小船里将嫌犯捕获。一个全球关注的事件得以安全告一段落。
当然在这个事件的整个过程中,我最关注的事情还是和大数据有关的crowdsourcing,中文翻译为,“众包”。这个词来自2006年Wired杂志的一篇著名文章《众包的崛起》(The Rise of Crowdsourcing),意思和外包相似,只是众包的分包对象更广,并且几乎完全(只能)通过互联网连接,与此同时,几乎无法预估任务完成的时间与质量(因为无法预估有多少人接受分包)。
在波士顿爆炸案的破案过程中,FBI使用了众包的手段:
一、保留Copley广场附近的所有监控录像以供比对、查找,波士顿警察局的官员称“将仔细查看所有录像的每一帧画面”。
二、走访事发地点附近12个街区的居民,收集可能存在的各种私人录像,照片,无论他们来自摄像机还是私人的手机。
三、大量收集网上信息,包括像Twitter、Facebook、Vine、Youtube等社交媒体上出现的相关照片和录像等。
四、向公众提出了收集相关信息的请求。
这样一个似乎非常公开的案件的侦察及侦破工作使用了各种高科技的手段,充满了大数据的味道,无形中符合了大家对大数据理解中著名的4V原则:
一、Volume(数据量):来自各方的数据量是非常大的。
二、Variety(数据种类):各种数据源,特别是来自各种社交媒体上的图像、影像类的非结构化数据非常丰富。
三、Velocity(速度):在事件发生数分钟之内,已经有大量信息发布在各种社交媒体上。另外对这样高曝光度的社会事件的侦破,速度本身就是最重要的。
