tidyverse实战——利用疫情数据
利用tidyverse进行疫情数据实战分析 数据来源:约翰霍普金斯大学持续更新的开源项目(CSSEGISandData/COVID-19),包含确诊数 、死亡数和治愈数三个数据集 。分析工具:主要使用tidyverse套件中的readr、dplyr、tidyr等包进行数据读取 、清洗和转换 ,并利用barRacer包制作动态条形图。
tidyverse是一个由一系列R包组成的生态系统,旨在让数据传输、清理和转换变得简单、有扩展性、可读性和一致性。tidyverse包括常用的包dplyr和tidyr,分别用于数据处理和转换 ,以及总结数据中的缺失值和非方便型的列 、行 。在学习ggplot2和tidyverse之前,需要掌握R语言基本知识和一些绘图基础知识。
数据标准化:scale()函数对物种丰度数据进行Z-score标准化。
关卡1:R 基础(2-3 周)核心目标:掌握数据处理与可视化的核心技能,为Shiny开发奠定基础。学习内容:学习《R for Data Science》的1-21章,重点掌握:tidyverse的数据处理理念 。readr的读取操作。dplyr的核心操作(如过滤、转换、分组聚合)。ggplot2的可视化理念与核心操作 。
设置环境首先 ,确保你已经安装并加载了必要的R包。常用的包包括lme4用于拟合混合效应模型,ggplot2用于数据可视化,以及tidyverse用于数据处理。

我们每天关注的疫情分布图是怎么做出来的?
〖壹〗 、随便找个网站 ,拔下来一份最新的疫情数据 点击开始制作图表--- 创建图表 --- 选取地图---标准中国地图 数据编辑--- 导入excel 。即可将我们准备的疫情数据导入 4,调整颜色 通过参数调整。在值域中通过修改值域范围和控制器颜色。可以简单的做出一个还不错的图表 。另外,图说里面还有其他很多常用的图例。
〖贰〗、比例分级方法的优势与不足:依据病例数量按照统一的比例进行符号化 ,每个地市病例的数量与符号的尺寸成正比,人眼对尺寸变量极为敏感,可非常直观地捕捉到不同地市病例的数量差异及其空间分布关系(如图8)。但每种疫情地图都有两面性 ,通过此图则难以直接分辨出不具有显著特征的地市的具体情形 。
〖叁〗、使用小O地图的【地图可视化】功能,制作疫情风险热力图。在小O地图中,选取【地图可视化】-【热力图】。导入包含风险等级(或相关权重)的Excel表格数据。根据数据生成热力图 ,通过颜色深浅表示风险等级的高低 。
〖肆〗 、在小O地图中,选取高德地图作为底图。配置地图:根据需要调整地图的样式、颜色、标签等。确保行政区名称和病例数能够正确显示在地图上 。加载数据并显示:点击“加载 ”按钮,将Excel表格中的数据加载到地图上。地图将按照行政区显示不同的病例数,形成疫情分布图。
如何使用EXCEL制作百色新冠疫情分布行政区地图
在小O地图中 ,选取高德地图作为底图 。配置地图:根据需要调整地图的样式 、颜色、标签等。确保行政区名称和病例数能够正确显示在地图上。加载数据并显示:点击“加载”按钮,将Excel表格中的数据加载到地图上 。地图将按照行政区显示不同的病例数,形成疫情分布图。
数据准备:从官方通告wsjkw.gxzf.gov.cn/ztbd_...获取截至2月9日的累计病例数 ,如德保县162例等。 完善数据:在EXCEL中总结数据,包括行政区名和病例数,使用小O地图的功能补充所需列 。
登录平台:打开迪赛智慧数官方网站并登录。选取组件:进入设计界面 ,点击左侧【组件】,在其他图片中选取主题河流图,点击或者拖拉到设计面板就可以生成图例。编辑数据:选中图表 ,点开右侧菜单【数据】,在该页面下能够编辑图表的数据、图表的属性等,也可以直接导入准备好的excel表格数据 ,数据格式借鉴图例模板。