本篇文章由 VeriMake 旧版论坛中备份出的原帖的 Markdown 源码生成
原帖标题为:R 语言——可视化
原帖网址为:https://verimake.com/topics/172 (旧版论坛网址,已失效)
原帖作者为:影子(旧版论坛 id = 31,注册于 2020-04-18 22:48:16)
原帖由作者初次发表于 2020-10-22 21:44:44,最后编辑于 2020-10-22 21:44:44(编辑时间可能不准确)
截至 2021-12-18 14:27:30 备份数据库时,原帖已获得 646 次浏览、0 个点赞、0 条回复
R 中包含三种不同的绘图系统来实现可视化功能:
(1)base图形:R中历史最悠久的画图系统,操作简单,不过功能不完善,代码工作量大。将base图形经过一些改进,出现了grid图形,grid图形可以指定画点、线、面的位置,缺点依旧是画图需要写入大量代码。
(2)lattice系统:它是建立在grid系统上,为所有常见的图表类型提供了高级函数。相比于grid系统,lattice系统有两个显著优点,一是可以将绘图的结果保存,可以将绘图结果赋值给变量,这样只要对变量修改就可以灵活画出相关的图形;二是可以在一个格子里包含多个面板,可以将不同的数据分成不同的类别,便于比较差异。
(3)ggplot2系统:目前使用广泛的一个画图方式,它也是建立在grid系统上的。接下来我们具体介绍一下ggplot2系统的功能。
##1.使用ggplot2画散点图
ggplot2( “2”是指理想的版本)经过从 lattice 系统中不断改进, 并基于它所建立。每个绘图由 ggplot 函数创建,第一个参数是一个数据框,第二个是 aesthetic,把 x 和 y 列变量 传递给 aes 函数。然后,我们再添加一个 geom 让图形系统显示一些点。(在这里我们选用PK代码的数据集来示范)
1)绘制简单的散点图


ggplot2 中shape 取代了 pch,颜色可使用 color 或 colour 来 指定:


2.线图
如果想研究连续变量如何随时间变化,线图往往比散点图更加容易理解,因为它能显示邻 近数值之间的联系,可以通过传统 ylim 参数来手动设置 y 轴的大小。


3.直方图
如果你要研究一个连续变量的分布,直方图是最佳选择 。


4.箱线图
如果你想研究大量相关变量的分布,可绘制大量的直方图,在 ggplot2 中绘制箱线图只需我们添加一个 geom_boxplot(待补充)