En esta sesión estaremos revisando la librería ggplot2
y cómo usar para visualizar los datos, en especial para agregar más elementos para el análisis exploratorio (EDA).
📺 [ Video ]
💻 [ Script ]
Thomas Lin Pedersen es uno de los autores, junto con Hadley Wickham y Danielle Navarro, de uno de los libros de referencia del paquete ggplot2
, que es parte del Tidyverse
y una de las más interesantes librerías para generar visualizaciones de alto nivel y personalización. Puedes revisar el libro ggplot2: Elegant Graphics for Data Analysis.
Hay un par de capítulos de otros libros que nos parece bueno que les eches un vistazo son:
Y por último, en esta página se muestran muchos tipos de gráficos y cómo hacerlos con ggplot2
. Es un recurso muy interesante, que te servirá no solo para este módulo, sino para más adelante. Muy recomendable!
En esta charla abordamos diversos aspectos sobre cómo la inteligencia artificial y el NPL (natural processing language) apoyan el análisis de textos clínicos. Expone Jocelyn Dunstan, Doctora en Matemática Aplicada Universidad de Cambridge, Académica de la Facultad de Medicina Universidad de Chile y Científica en el Centro de Modelamiento Matemático.
Conoce más sobre Jocelyn Dustan en su web personal.
En esta sesión seguimos revisando cómo usar la visualización para sacar información de los datos. En particular, veremos la librería highcharter,
que nos permite realizar gráficos de alta calidad y agregarle interactividad.
📺 [ Video ]
💻 [ Script ]
El script usado también puedes revisarlo en el siguiente proyecto de RStudio Cloud.
Repo oficial de la librería highcharter
Personalizar las distintas partes de los gráficos realizado con ggplot2 es uno de los temas más fascinates, pero no siempre es tan fácil. Para ayudarte en eso, acá puedes ver un configurador que te entrega los códigos para ir personalizando las partes de los temas. Revisa las otras secciones de esa web, puedes ver todas las funciones de las aesthetics
y las scales
.
Revisa este repositorio que contiene una gran selección de extensiones para la librería ggplot2
, aumentando sus funcionalidades con muchas cosas interesantes y de gran utilidad.
Thomas Lin Pedersen, además del libro digital que mencionamosm, tiene un par de videos en Youtube (con cerca de 2 horas cada uno) en donde habla sobre la librería ggplot2
, cómo entender la lógica que usa (de capas) y explica con varios ejemplos.
También puedes visitar su GitHub en donde tiene todos los scripts y ejercicios mostrados en los videos.
Muy recomendado!
También te recomendamos ver este video de la NHSR Community.
🖐️ [ Taller ]
💻 [ Script ]
🟨 Revisa la carpeta Docs
, en la cual se irán dejando documentos, papers y presentaciones complementarias interesantes para este módulo. Revísalo con frecuencia.
La visualización de datos es un campo muy extenso y que aporta mucho valor a los análisis, entendimiento y comunicación. Es aconsejable profundizar en esta área.
Independiente de que continues con los siguientes módulos, te aconsejamos que sigas estudiando sobre visualización.
Para ello, te dejamos los siguientes recursos:
- Data visualization with R
- Fundamentals of data visualization
- Workshop on "Graphic Design with ggplot2" (muy recomendable!)
Si llegaste hasta acá y realizaste los módulos 1, 2 y 3 siguiendo todos los consejos y practicaste mucho, estás más que capacitada/o para realizar el curso de IBM Cognitive Class de visualización con R sin mayores problemas.
👉 Ir al curso y obtener el certificado.