Limpieza y enriquecimiento de datos con Open Refine (Enero 2020) - CURSO PRESENCIAL

Tecnologías de la documentación

La limpieza de datos se puede definir como procesos mediante los cuales se detecta y corrige la información incorrecta, incompleta, imprecisa, sin normalizar o innecesaria. La limpieza y el enriquecimiento de datos son elementos primordiales del ciclo de la curación digital. Open Refine es una poderosa herramienta que nos permite trabajar de una manera sencilla con datos que necesitan ser curados y transformados en datos limpios y listos para ser reutilizados o analizados.

El curso tratará el uso de la herramienta Open Refine a distintos niveles y comenzando con su instalación y configuración. Se abordará la carga de datos en distintos formatos, la ordenación y filtrado, el análisis exploratorio, los diversos facetados disponibles, la normalización y desambiguación automática de autoridades, las transformaciones masivas, así como el cruce de datos con fuentes externas.

  • Horario clases prácticas: 30 y 31 de enero de 2020 de 16 a 20:30 horas.
  • Lugar: Calle Fuencarral, 160 Entreplanta. (2Formación) — 28010 Madrid



  • Objetivos

    El curso tiene por objetivos:

    • Comprender los principios de la curación de datos incluidos sus elementos de calidad e integración
    • Aprender a instalar la herramienta Open Refine y cargar datos de diversos formatos
    • Conocer las funcionalidades básicas de ordenación, facetado y filtrado de datos
    • Realizar un análisis exploratorio básico para detectar problemas en los datos
    • Utilizar diversas estrategias para transformar y normalizar datos de manera masiva
    • Explorar las funcionalidades de desambiguación de autoridades y de enlace con datos externos
    • Conocer los elementos básicos de las expresiones regulares y su aplicación en Open Refine


    Destinatario

    El curso está destinado a Bibliotecarios, Documentalistas o Archiveros que trabajen, o tengan interés en trabajar con datos de manera masiva para su limpieza y enriquecimiento.