1. 项目名称
视不可挡,图解战“疫”
2. 团队信息
团队名称:大数据战“疫”团队
指导教师:陈晓慧,信息工程大学
队长:夏毅,信息工程大学
成员:赵卓,信息工程大学
3. 作品说明
疫情当前,共克时艰。在新型冠状病毒感染的肺炎疫情牵动社会人心的关键时刻,我们组希望运用信息可视化的方法,以 Overview to Detail 的分析思路,从宏观上对新冠肺炎疫情空间分布及时序变化进行分析,从微观上对疫情较为严重、有代表性的湖北省、河南省进行疫情态势分析。最后,对具体患者的病例进行可视化,发现部分新冠肺炎患者的患病模式,运用 SEIR 模型定性模拟疫情爆发趋势及不同预防措施对疫情的影响。
本作品分一共分5个主题,分别:
新冠肺炎疫情空间分布分析
新冠肺炎疫情时序分析
湖北省新冠肺炎疫情态势
河南省新冠肺炎疫情态势
病例与防控措施可视化
每个主题均就所在方面对新冠肺炎进行可交互式的可视分析,力求帮助人们深入了解目前疫情态势。
4. 作品演示视频
视不可挡,图解战“疫” 腾讯视频地址 :https://v.qq.com/x/page/i3074qkhfja.html
5. 界面展示图
(1)新冠肺炎疫情空间分布分析
(2)新冠肺炎疫情时序分析
(3)湖北省新冠肺炎疫情态势
(4)河南省新冠肺炎疫情态势
(5)病例与防控措施可视化
6. 作品详细解读:
本作品分一共分5个主题,分别是新冠肺炎疫情空间分布分析、新冠肺炎疫情时序分析、湖北省新冠肺炎疫情态势、河南省新冠肺炎疫情态势、病例与防控措施可视化。每个主题均就所在方面对新冠肺炎进行交互式的可视化分析,力求帮助人们深入了解目前疫情的相关情况以及爆发的模式,接下来将就这5个主题分别进行说明。
一、新冠肺炎疫情空间分布分析
第一个主题主要是分析新冠疫情爆发后空间分布上的特点。发现其空间分布特征。
1.1 世界新冠肺炎确诊病例分布图
以六角格编码每一个国家,通过颜色区分世界各国的疫情严重情况,通过世界确诊分布图,我们可以直观看出中国,日本以及周边东南亚国家(菲律宾,文莱等国)疫情较为严重。在欧洲及每周也有局部比较严重的地区。
1.2 中国新冠肺炎病例分布图
通过六角地图可以直观看出中国各省的确诊病例数、治愈率及治愈数和死亡病例。有效的避免了地理地图所带来的视觉困扰。
通过点击对应的省,将会与六角地图上的数字以及全国新冠肺炎死亡数分布图、全国新冠肺炎治愈率分布图进行交互,方便用户直接观看对应的省的所有疫情特征。
1.3 中国新冠肺炎病例分布特征分析
左图为矩阵树图,直观显示目前各省市的确诊人数占比。
中间图为饼状图和折线图的结合。首先通过左上角的筛选器选择对应的要看的特征(确诊,治愈,死亡),然后将显示该省(矩阵树图选择)在这一段时间内对应特征的变化情况,而堆叠在每一个时间节点上对应的饼状图则代表这个时间该省所有城市的各自大小及占比。
右图为雷达图,三个维度(确诊数,治愈数,死亡数),代表对应省目前的确诊数,治愈数,死亡数。
三张图通过矩阵树图选择对应的省,进行交互分析。
二、 新冠肺炎疫情时序分析
主题二主要是分析新冠疫情爆发后时序特点。发现其时序变化特征。
2.1 全国疫情分类集合图
分类集合图的圆环分别代表各个省的确诊,治愈,死亡情况;圆环的大小代表其所在省的确诊总量,确诊数越多,则圆环越大;圆环上的数字代表累计确诊的总数。
通过左上角的时间控制器变化,可以观察各省的三个特征随着时间变化的情况,以及确诊数的总量变化情况(圆环大小)
2.2 日历图
观察所有省自 1 月 22 日以来确诊数的变化情况
通过左图的矩阵树图选择省,右边折线图代表所在时间当日的新增确诊数及死亡数,面积图代表截止所在时间总的确诊数及死亡数。
三、 湖北省新冠肺炎疫情态势
主题三主要分析湖北省的具体疫情态势。
3.1 湖北省疫情分布图
湖北省疫情分布图以六角格编码湖北省每一个城市,数字代表对应城市的疫情确诊数。
3.2 湖北省疫情分布热力图
从热力图我们可以看出湖北各市及湖北东北部的各省市以及广东省的疫情较为严重,对于疫情目前的趋势有个总体的把握。
3.3 区域折线图
左侧的三个折线图分别代表着治愈数,死亡数,确诊数随时间变化情况。每一个点的大小带表当日的增量,折线带表目前总的数目。同时可以筛选多个省进行对比分析,从图中我们可以看到湖北省在 2 月 14 日左右相较于其他日期确诊数与死亡数均有明显提升。
右侧柱状图高度代表治愈数,宽度代表死亡数,通过柱状图的可以直观观察目前的四晚熟与治愈数,以及各省的疫情严重情况。同时,可以通过筛选多个省进行对比分析。
3.4 气泡图
气泡图横坐标为确诊数,纵坐标为死亡数,通过左上角时间轴的变化,选中省的各个城市会随之变化,清楚看出对应省的各个城市的死亡数与确诊数变化情况,可以选择对应左侧省份筛选器中对应的省份,同时可以具体观察对应时间的相应气泡图情况。
四、 河南省新冠肺炎疫情态势
主题四主要分析河南省的具体疫情态势。
4.1 河南疫情分布图
河南省疫情分布图以六角格编码河南省每一个城市,数字代表对应城市的疫情确诊数。直观的观察疫情的变化趋势,从图中可以看出信阳、郑州、南阳和驻马店疫情较为严重。
4.2河南累计确诊病例变化图
从初期看,确诊病例增长速率是极大的,说明不进行相应的防护措施,疫情会极快的扩展开。从治愈和死亡的人数来看,初期治愈人数少,且增长缓慢,从2月2日,治愈人数开始快速增加,说明在经历前期治疗后,治疗水平和治疗能力在不断提升,特别最近几日,新冠肺炎增长趋势进一步降低,隐约出现“拐点”;从死亡人数来看,河南省的确诊病例死亡率维持在较低的水平。截止2月20日24时,治愈人数累计717人,治愈人数再度增加,治愈率达56%,河南省累计治愈病例超过半数,确诊病例治愈情况逐渐好转。
4.3 河南省确诊病例迁徙图
通过收集河南省各地医院确诊病例数据,可以看出,在外来确诊病例中,大部分确诊病例来自湖北省,有少数病例分别来自越南、泰国、北京、上海、广西、广东、云南、湖南、山东、浙江、四川、海南、安徽、重庆等地。
4.4 河南省确诊病例来源图
通过收集河南省各地医院确诊病例数据,可以看出,在外来确诊病例中,大部分确诊病例来自湖北省,有少数病例来自其他省份(除湖北省),还有部分病例是由于潜伏期患者早期在河南省内流动导致的,由于至2月6号全国各省市管控措施的加强,河南省由于外来人口流动导致的新增病例已经大大减少。
4.5 河南省确诊病例类型金字塔图
通过收集河南省各地自1月21日起至2月11日的确诊病例数据,可以看出,从1月21日河南省确诊首例外来输入型病例以来,在1月下旬由于春运带来的大量人口流动导致这段时间外来输入的病例增长达到高峰,特别是1月25日(大年初一)确诊病例增长有一个峰值。自2月开始,由于管控措施的加强,省外输入的病例开始下降,但由于早期潜伏期患者的流动导致年后本地传播型的病例数量上升,自2月上旬开始,不论是省外输入还是本地传播所致的病例数都呈现出了下降趋势,反映了河南省防疫管控措施的加强。
五、 病例与防控措施可视化
主题五对具体患者的病例进行可视化,发现部分新冠肺炎患者的患病模式。通过SEIR模型进行可视化,对防控措施进行分析。
5.1 部分病例甘特图
通过将收集到的 72 个病例运用甘特图的方式可视化,方便医护人员直观了解每一个患者的患病周期及周期中的每一个阶段,同时方便横向对比分析病例,发现患者的患病的共同特点,如从首次接触携带病原体的患者到首次出现症状的时间等。
5.2 SEIR模型模拟
运用 SEIR 模型利用河南省的部分数据通过设置合适的参数对疫情进行模拟。同时改变部分参数以代表相应与他人隔离、戴口罩的情况。通过模拟发现,通过戴口罩与与他人隔离可以有效遏制疫情蔓延,利于最终控制疫情。
7. 作品技术说明
作品实现的整体流程包括疫情数据获取、疫情数据整理与清洗、疫情数据挖掘、疫情数据可视化这4 个步骤。
疫情数据获取:通过编写python 的 scrapy爬虫框架爬取丁香园的实时疫情数据,其中包括各省市的确诊病例,治愈病例以及死亡病例。同时通过手工对国家卫健委,各省卫健委以及百度实时疫情等平台的数据进行整合,实现多来源搜集数据,交叉验证数据的准确性。
疫情数据整理与分析:通过 Excel,python,pandas 等工具对于爬取来的数据进行初步的整理,同时通过对于爬取到数据中的明显异常值进行清洗,对于一些明显的格式错误进行修正,对于一些当天的空值进行填 0 补齐,为接下来的数据挖掘以及数据可视化做准备。
疫情数据挖掘:首先计算各省的平均值,四分位数等统计疫情数据特征,然后通过现有的知识构造出存量,治愈率等特征进行综合分析,最后通过聚类的数据挖掘方法对于全国及各省疫情的爆发地区进行挖掘。
疫情数据可视化:在前期对疫情数据进行了整理及初步的挖掘后,我们通过 Tableau,Ecahrts.js,Mapbox.js以及python Matplotlib 等工具进行可视化。运用的可视化方法包括统计地图(六角格编码)、矩阵树图、极坐标堆叠图、气泡图、甘特图、桑基图等方法,利用 Overview to Detail 的分析思路对于疫情进行逐步的可视分析,发现疫情爆发的时间与空间等多方面特征,对防治疫情提出相关建议。
8. 项目是否开源
代码需要进一步完善,暂时不开源