Curación de datos con Open Refine (Febrero 2018)

Tecnologías de la documentación

La curación de datos incluye actividades como la limpieza, normalización, integración o el enriquecimiento de los mismos. Open Refine es una poderosa herramienta que nos permite trabajar de una manera sencilla con datos que necesitan ser curados y transformados en datos limpios y listos para ser reutilizados o analizados.

El curso tratará el uso de la herramienta Open Refine a distintos niveles y comenzando con su instalación y configuración. Se abordará la carga de datos en distintos formatos, la ordenación y filtrado, el análisis exploratorio, los diversos facetados disponibles, la normalización y desambiguación automática de autoridades, las transformaciones masivas, así como el cruce de datos con fuentes externas.



Objetivos

El curso tiene por objetivos:

  • Comprender los principios de la curación de datos incluidos sus elementos de calidad e integración
  • Aprender a instalar la herramienta Open Refine y cargar datos de diversos formatos
  • Conocer las funcionalidades básicas de ordenación, facetado y filtrado de datos
  • Realizar un análisis exploratorio básico para detectar problemas en los datos
  • Utilizar diversas estrategias para transformar y normalizar datos de manera masiva
  • Explorar las funcionalidades de desambiguación de autoridades y de enlace con datos externos
  • Conocer los elementos básicos de las expresiones regulares y su aplicación en Open Refine


Destinatario

El curso está destinado a Bibliotecarios, Documentalistas o Archiveros que trabajen, o tengan interés en trabajar con datos de manera masiva para su limpieza y enriquecimiento.