Pivoting (e dintorni)

{tidyr}

Ispirazioni e fonti…

R for Data Science 2nd Edition: Capitolo 6: Data tidying.

Due tipiche strutture tabellari

Trasformazioni (pivoting)

Altre strutture dati / trasformazioni (cenni)

  • Nested data: un nested data frame è un data frame dove una (o più) colonne è una lista di dataframe

    • la funzione nest() permette di creare nested dataframe
    • la funzione unnest() permette di tornare indietro a strutture piatte
    • questo tipo di strutture sono utili in congiunzione con le funzioni dei package tidymodels e broom
  • Rectangling: serve per trasformare una lista annidata (spesso su più livelli) in un dataset tidy (righe vs colonne)

    • Si tratta di dati tipicamente in formato JSON o XML di solito “catturati” sul web (web scraping)
    • unnest_longer() trasforma ogni elemento di una lista-colonna in una nuova riga
    • unnest_wider() trasforma ogni elemento di una lista-colonna in una nuova colonna
    • hoist() simile ad unnest_wider() ma estrae solo elementi selezionati e può raggiungere più livelli
    • per input complessi altre funzioni specifiche sono disponibili nel package tibblify

Per gli esempi…

… consulta il file con il codice!