大数据的力量 | “接触”过新发地的30多万人是如何被“找”到的?

时间:2020-07-03 相关资料下载



人工智能、大数据、物联网、区块链作为当今信息化发展的新兴技术,离我们的生活越来越近。大数据时代的背景下,在纷繁的数据中找到规律并创造价值是大数据发展的核心思路。


“经过全市大数据分析,您可能在5月30日含以后去过新发地批发市场……”近日来,随着北京新发地市场新冠源头被锁定,大数据筛查,成为不少北京市民在朋友圈中热议的话题。

一组数据显示,截至6月17日,在行动轨迹一致的情况下,利用大数据分析相关风险人群位置和路径,北京用了短短几天时间,就“找”出了30多万人进行核酸检测。

▲ 图片显示了5月29到6月12日到访过新发地的人群,发现2430人到访新发地市场并离开北京,其中有91人到访上海。图表还详细列出了这2000多人到访过的其他城市,包括廊坊、保定、天津等。


在以前,我们会觉得在茫茫人海中找到某个人是没有办法实现的;而当下,运用大数据实现精准定位让这件事成为了可能。


从6月15日以来,不少路过或者去过新发地的北京市民,都接到了短信或者是社区电话,表示通过大数据筛查,确认被调查者近期去过或者路过新发地市场,要求如实填报信息,并尽快进行核酸检测。



那么,大数据到底是怎样找到新发地的路过者呢?大数据筛查到底是怎么实现的呢?


大数据,顾名思义就是海量、大量的资料,这些资料来源于随时产生的数据;而大数据又分为狭义和广义两种。狭义的大数据包括个人私人信息、购物习惯、阅读习惯等个人画像;而广义的大数据则是针对社会或者企业的,例如电商利用大数据分析顾客购物习惯,做好需求预测,提前布局好仓库存储等等。

此次新发地的“大数据筛查”,就是广义大数据与狭义大数据的一次有机融合,也是海量存储和快速检索技术的一次良好利用。



尽管官方并未公布大数据筛查的具体方法,但中科曙光大数据总工程师首席科学家、存储产品事业部副总经理宋怀明博士分析认为,北京之所以能够实现利用大数据快速排查筛选新发地到访者,有三种技术路径可以实现。



| 首先是基于手机移动数据确定位置信息,也叫基源定位方法。

这是最常用的方法,也是此次新发地大数据筛查当中,效率最高的手段:不过基源并不是GPS,而是通过手机基站,与GPS使用时才打开不同,手机会自动连接到距离最近的信号发射塔,手机的所有活动,都能通过包含基站信息的信令数据信号发射塔筛查回溯,这为追踪使用者的位置定位及路径追踪,提供了真实准确的第一手数据。



| 其次是通过社会交往信息分析。

这并不是指通过社交软件信息判断,而是结合已有数据,通过电话调查、摸排走访等方式,最终形成相对可靠的数据信息,也可以在短时间内筛选出哪些人在新发地工作、哪些人曾经去过新发地、他们这几天密切接触了什么人等等。


| 第三种方法是可以通过物品信息确认。


此次新发地筛查过程中,除了对经过者、密切接触者的筛查,也排查了不少物品和货品,在这个过程当中,通过对特定携带病毒物品的路径和接触者追踪,同样可以作为排查查找到新发地密切接触者的依据之一。



除了实现精准人员筛查之外,大数据在预测分析流行病上也有重要的应用。早在2008年,谷歌便发布了“Google Flu Trends”(谷歌流感趋势),利用关键词追踪技术搜集数据,如果在某一地区的某一时间段内,有大量关于流感、发热、感冒等关键词的搜索,就表明此地存在潜在的感染人群,需要引起相关部门的重视。

▲ 谷歌曾经开发了软件,利用大数据分析流感趋势,但最终以失败告终。

在北京新发地新冠疫情的防控和分析中,大数据同样起到了重要作用。在预防层面,针对人员聚集可以进行预警;在控制源头扩散方面,把数学模型和人员社交特征结合,可以很好分析扩散路径与速度,制定更有针对性的对策与措施。北京此次做到了精准分级,没有“一刀切封城”,而以街道为单位划分风险等级,进行分级管控。



除了在疫情期间的重大作用,大数据人工智能分析在其他领域也取得了令人瞩目的成绩,商业金融领域也是其一。发展至今,商业金融领域存在的海量数据,为人工智能数据挖掘提供了宝库。

商业金融大数据与数据科学科研训练营,以商业金融大数据为研究对象,采用人工智能方法,实践商业金融案例的大数据分析过程,从中挖掘出巨大的潜在商业价值。最后,学生完成一个客户/消费者数据分析项目,进一步熟练掌握大数据、人工智能的相关知识与技能。


大数据时代的背景下,在纷繁的数据中找到规律和结论并创造价值是核心的思路。而如何在海量的数据中将有价值的信息分类、汇总及分析,同时将大量的数据和结果以更直观、美观的方式的展示出来,并让人快速的获取是行业内聚焦的重要方向。

R语言具有的灵活性、开放性,使R语言在大数据处理中的应用也越来越被学界和业界所重视。多种大数据架构平台上已经提供了基于R语言的编程插件。借助R的高效性,可以使得对大数据的分析事半功倍。现代深度学习库,例如Keras都已经支持了R语言。

数据分析与人工智能线上学术营,在编程语言和相关理论基础的支持下,通过典型案例分析,使学员在短时间内了解与掌握大数据的知识与技能,培养其科学与创新思维,提高分析和解决实际问题的综合能力,为未来研究和工作奠定基础。


相关资料下载
暂无资料
热门推荐 /Popular recommendation
返回顶部