En todo trabajo con análisis de datos se requiere de limpieza y transformación de datos, pero frecuentemente es la parte a la que queremos dedicarle menos tiempo, pero es la más importante, sin este trabajo nuestro análisis no sería certero y podría no tener el mismo impacto, existe la frase popular: basura entra – basura sale, por eso es que debemos garantizar de que nuestros datos sean de calidad antes de comenzar a visualizar cosas… En este taller compartiré una serie de trucos y herramientas avanzadas que ayudan mucho para poder trabajar en estandarización, normalización/denormalizacion y deduplicación de datos. Algunos recursos que se verán en el taller son: ETLs, GDS, grafos, clustering, fuzzyMatching.