Introducción

Uno de los grandes potenciales de R es su capacidad para generar gráficos, figuras, visualizaciones de datos complejas, diversas y adaptadas a cualquier tipo de situación y requerimiento. Todo ello sin tener que recurrir a ediciones posteriores de las figuras en otros programas, es decir, sacando imágenes en cualquier formato listas para su publicación desde nuestras líneas de código. Y por supuesto, aprovechando la inmensa comunidad de usuarios de R que han aportado todo tipo de soluciones, variaciones y creaciones para la visualización de datos.

Aunque el principal atractivo ahora mismo reside en utilizar la visualización del paquete ggplot y sus extensiones, como parte del universo tidyverse, y que veremos con mucha más profundidad en el siguiente tema, es necesario conocer cuál es el punto de partida básico en el que iniciarnos.

Vamos a empezar con los primeros gráficos con R. Para ello vamos a cargar algunos datos para el trabajo. El primero lo cargaremos con la función data() llamado “AirPassengers”, que ya está precargado y contiene datos de pasajeros a lo largo de una serie de años. El segundo es un archivo con datos de pacientes con colesterol (“chol.txt”) y disponéis de él en los materiales descargables.

Nuestra primera visualización: función plot()

Para ello, vamos a usar la función data(AirPassengers) para cargar nuestro archivo de datos de pasajeros, que nos creará un objeto con ese mismo nombre. Con la función str()podemos ver qué estructura tienen nuestros datos y veremos que es una especie de matriz, que expresa datos mensuales de viajeros. Es la forma que toman las series temporales (“ts”) en R. La función class() lo confirma.

data("AirPassengers")
class(AirPassengers)
## [1] "ts"
AirPassengers
##      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 1949 112 118 132 129 121 135 148 148 136 119 104 118
## 1950 115 126 141 135 125 149 170 170 158 133 114 140
## 1951 145 150 178 163 172 178 199 199 184 162 146 166
## 1952 171 180 193 181 183 218 230 242 209 191 172 194
## 1953 196 196 236 235 229 243 264 272 237 211 180 201
## 1954 204 188 235 227 234 264 302 293 259 229 203 229
## 1955 242 233 267 269 270 315 364 347 312 274 237 278
## 1956 284 277 317 313 318 374 413 405 355 306 271 306
## 1957 315 301 356 348 355 422 465 467 404 347 305 336
## 1958 340 318 362 348 363 435 491 505 404 359 310 337
## 1959 360 342 406 396 420 472 548 559 463 407 362 405
## 1960 417 391 419 461 472 535 622 606 508 461 390 432

A continuación vamos a utilizar la función fundamental de los gráficos de R, que es plot(). Esta función va a ser capaz de reconocer el tipo de datos del objeto que le introducimos como parámetro y lanzar un tipo de gráfico por defecto. En el caso de una serie temporal por meses como el nuestro, nos lanzará un gráfico de líneas que nos dice cómo evoluciona la cantidad de pasajeros a lo largo del tiempo.

plot(AirPassengers)

Puesto que estamos en un curso para trabajar con datos ambientales, vamos a seguir con un ejemplo más específico. Nos vamos a valer de unos datos de calidad del aire contenidos en el dataset airquality, que no tenemos ni que precargar. R lo va a reconocer por defecto y nos a va a devolver una tabla de datos de ozono y datos meteorológicos.

head(airquality)
##   Ozone Solar.R Wind Temp Month Day
## 1    41     190  7.4   67     5   1
## 2    36     118  8.0   72     5   2
## 3    12     149 12.6   74     5   3
## 4    18     313 11.5   62     5   4
## 5    NA      NA 14.3   56     5   5
## 6    28      NA 14.9   66     5   6

La función plot()nos va a funcionar de manera automática también con esta, interpretando que tiene que relacionar entre sí todas las variables. Esto a veces puede ser útil para una primera vista de exploración de nuestros datos:

plot(airquality)

La relación entre temperatura y ozono parece mostrar una mayor correlación. Aunque los datos son muy antiguos y corresponden a un periodo estival de Nueva York, si seguís las noticias sobre calidad del aire de las noticias esta relación os sonará familiar.