Laboratorio de validación y limpieza

Metas de aprendizaje

Al finalizar este laboratorio habrás aprendido a:

  1. Utilizar la herramienta OpenRefine para la validación y limpieza de datos sobre biodiversidad
  2. Utilizar la herramienta Species Matching de GBIF para la validación de la taxonomía de un conjunto de datos y obtener la taxonomía superior.
  3. Estandarizar las fechas bajo el formato ISO 8601 con la herramienta Date Parsing de Canadensys.
  4. Convertir de forma masiva las coordenadas documentadas en formato grados, minutos, segundos a grados decimales.
  5. Validar la coherencia de la ubicación de las coordenadas respecto a la geografía superior usando las herramientas OBIS ploter y QGIS.

Guías

Glosario

  • Calidad de datos: Se define como la capacidad de los datos de satisfacer las necesidades del quien los usa.

  • API: Funciona como un mensajero que genera una solicitud a un programa/base de datos y retorna una respuesta apropiada a la solicitud inicial. Técnicamente son un conjunto de comandos, funciones y protocolos informáticos que las aplicaciones pueden seguir para comunicarse entre ellas, aseguran la conectividad entre aplicaciones, páginas portales etc. De esta manera las APIs permiten hacer uso de funciones ya existentes en otras plataformas o páginas, sin necesidad de crearlas desde cero. Conoce más en los siguientes videos:
  • GBIF: Infraestructura Mundial de Información en Biodiversidad— es una organización internacional y una red de investigación financiada por gobiernos de todo el mundo, destinada a proporcionar a cualquier persona, en cualquier lugar, acceso abierto y gratuito a datos sobre cualquier tipo de forma de vida que hay en la Tierra. El SiB Colombia es el nodo nacional de GBIF.

Lecturas y recursos externos

:wrench: Recursos

:books: Lecturas