团队成员:胡东篱、黄冬霞、蒋博
指导老师:赵颖
创作初心
在疫情的发展期间,通过对湖北省各市相关数据的展示以及分析其与疫情的关系并可视化,直观地表现与疫情相关的社会因素以及影响程度,方便人们了解疫情数据以及社会各因素与疫情的关系。作品对湖北省各市与武汉交通流数据、与武汉距离、人口数据、医疗数据等多源数据进行可视化,展示湖北省各市的社会情况;分析多源数据与疫情的关系,从交通、人口、医疗三个方面入手,展示他们与疫情的相关程度,从而让人们关注与疫情相关的社会情况。
作品简介
(1)作品介绍
①湖北总体数据展示与分析
该总体统计图以递减的方式展示了湖北各市的相关数据,包括人均生产总值、各市人数、人口密度、老年人口占比、卫生机构密度、各市确诊人数等方面信息。
在人均生产总值、人口密度、卫生机构密度和确诊人数信息中,条形图的长度代表数量的多少;在人数和老年人口信息中,用颜色深浅程度代表数值高低;床位数的部分,颜色和所占面积表示数量的多少。
②湖北十市疫情相关数据展示
湖北十市部分单位化地展示了湖北十市的生产总值、人口密度、卫生机构密度和单位人数床位数量信息,提供了各市经济、人口和卫生相关的具体数据。图片下方的折线图来自2020年1月25日至2020年3月20日湖北各市疫情趋势历史信息;折线图横坐标表示时间,纵坐标表示统计人数,不同颜色的曲线代表了不同类型的数据,包括各市累计确诊人数、现存确诊人数、治愈人数和死亡人数。
武汉市:
孝感市:
黄冈市:
荆州市:
襄阳市:
黄石市:
宜昌市:
鄂州市:
荆门市:
随州市:
③流量/距离与疫情的分析
该部分首先展示疫情早期武汉市到湖北省(除武汉)各市的人口流动情况;地图深浅表示三月中旬各市(疫情中期)的感染人数,直线颜色深浅表示从武汉到各城市的人口流量。
接下来的流量与各市感染人数散点图、距离与各市感染人数的关系散点图,表明距离的远近与感染人数并没有明显的规律,而流量的大小与感染人数呈现出了一个接近线性的关系;分析该情况是因为新冠病毒通过飞沫传染,与距离并无直接关系,而与人群最可能移动的路径长度(我们也可以称之为等效距离)有关系,这里我们用流量来表示人口流动的等效距离。
④人口因素与医疗因素与疫情数据的分析
这一部分我们采集了湖北省各市的相关数据,包括:人口密度(人/平方公里)、女性比例、老年人口比例(60岁及以上)、医疗机构密度(个/平方公里)、千人平均床位数(个/千人)、千人平均医疗技术人员数(个/千人)。通过多元回归分析建立函数,得到各因素与各市在三月中旬(疫情中期)感染人数、治愈人数、死亡人数的关联系数,从而得到各因素与疫情数据的相关程度,使用桑基图展示。
(2)社会价值
通过这个作品,用户可以了解到从疫情初期到中期湖北省各市的疫情情况的变化(确诊人数、死亡人数、治愈人数变化),湖北省各市的社会基本数据以及彼此的关系。通过对各因素的分析,例如流量与感染人数的关系,用户可以了解到交通封闭的必要性;通过对人口数据的分析,我们可以看到老年人口与感染人数的关联是较大的,说明老年人对该病毒的体抗力偏低,需要更加注意日常的防护。
(3)面向对象
希望了解疫情相关信息的人群,进行疫情关联性分析研究的人群,人口、交通、卫生相关管理部门。
作品价值及影响力
(1)价值
①数据收集的方法、相关数据集和关联性分析方法可用于多种场合。
②疫情相关数据展示,直观明了地传递出湖北各市的疫情信息和相关数据信息。
③分析关联性,分析疫情相关的因素,如疫情初期交通流量、老年人口所占比例、 等 方面内容,为疫情的防护、治疗和进一步研究提供基础信息和参考方向。
(2)影响力
①便于获取湖北各市疫情相关信息,引发民众对疫情的关注、对社会情况的思考。
②呼吁广大市民群众,在出行时重视武汉相关的交通流量、所在地人口密度、人口接触距离等因素,防患于未然。
③引起相关部门的重视,在控制疫情情况时,注意当地老年人口比例,注重交通流量的管控。加强医疗卫生方面的防护和建设,未雨绸缪,以达到促进各地疫情防治、社会长治久安的目的。
作品技术说明
(1)使用工具
Tableau、Python、spss、Photoshop
(2)数据来源:
①湖北省统计年鉴:
http://tjj.hubei.gov.cn/tjsj/sjkscx/tjnj/qstjnj/
②疫情实时数据获取:
https://zhuanlan.zhihu.com/p/105365487?utm_medium=social
④全国新型肺炎疫情实时数据接口:
⑤2019新型冠状病毒疫情时间序列数据仓库: https://github.com/BlankerL/DXY-COVID-19-Data
⑥2019新型冠状病毒疫情时间序列数据:
https://github.com/BlankerL/DXY-COVID-19-Data/blob/master/json/DXYArea-TimeSeries.json
(3)数据集处理
①数据处理
A.多源相关数据部分:获取湖北省各市的地图空间文件;查询和存储湖北省各市与武汉的交通流量、距离;搜索湖北省各市的人口密度等人口数据以及医疗机构密度等医疗数据;通过网络上给出的数据源对数据进行收集,使用Python对数据进行去重、补缺、清洗等,并将数据规律地存储与csv文件中便于后续使用。
B.各市疫情数据部分:通过爬虫爬取实时疫情接口和疫情历史信息数据仓库中的数据;处理json数据时,利用“湖北”作为关键词,提取出所有湖北相关的疫情历史信息;解析json文件结构,提取出湖北各市的疫情数据,进行时间戳转换后,按照不同的市作为划分,存入不同的文件;写入csv 文件后发现每个市同一天有多条记录,筛选时读取日期列,最终得到展示需要的各市疫情历史信息文件。
②制作过程
根据将要制作的图表要求,对整理好的csv数据文件进行匹配、合并、删减等操作,使用Tableau制作流量、距离与疫情数据的关系散点图;使用spss分析人口数据、医疗数据与疫情数据的关系,得到各项数据对疫情的影响程度情况,通过Tableau将人口、医疗数据与疫情数据的关系进行可视化展示。
根据湖北省各市疫情累计确诊人数排序,取累计确诊人数排名前十的市作为展示对象。Tableau绘制各市地图、疫情相关历史数据曲线以及基础展示数据。湖北省各 市多源数据化简、单位化处理后,借助Photoshop工具,利用图标个数定量表示生产总值、人口、卫生机构、床位数量等信息。