Validación geográfica con QGIS

Objetivo

Visualizar y validar con la herramienta QGIS la coherencia de la ubicación de las coordenadas respecto a la geografía superior documentada en los datos.

Introducción

Video introductorio de la 3 guía, da un contexto general sobre las herramienta y el desarrollo de la guía. Si lo prefiere pude realizar la guía siguiendo el paso a paso sin necesidad de ver el video.

Sobre la herramienta

:earth_americas: QGIS es un software para manejo de información geográfica que se ejecuta sobre multiples sistemas operativos como Linux, Unix, Mac OSX, Windows y Android. Ademas, soporta numerosos formatos y funcionalidades de datos vector, datos ráster y bases de datos. QGIS proporciona una creciente gama de capacidades a través de sus funciones básicas y complementos con los que podrá visualizar, gestionar, editar, analizar datos y diseñar mapas imprimibles.

QGIS es un software libre y de código abierto licenciado bajo GNU - General Public License, soportado como un proyecto de la Open Source Geospatial Foundation (OSGeo) por lo cual no requiere el pago de licencias. Es impulsado por un grupo de voluntarios que mantienen el software actualizado y las versiones estables, lo que lo mantiene a la par de otros software geográficos mas conocidos.

Requerimientos

  • Instalar QGIS, aquí se detallan las instrucciones básicas de instalación.

  • Contar con un procesador de archivos de texto como Excel.

  • Contar con un mínimo de 4GB de memoria RAM para el desarollo de esta guía. Sin embargo, para procesos con más de 20.000 registros biológicos se recomienda tener por lo menos 8GB.

  • Para un mejor rendimiento no habra junto a QGIS otros programas que consuman muchos recursos del computador.

Archivos de trabajo.


Paso 1 - Instalación de QGIS

  1. Diríjase al enlace de descarga de QGIS, acá encontrará los instaladores para todos los sistemas operativos.
  2. Descargue preferiblemente la versión disponible con soporte a largo plazo (más estable) de acuerdo al sistema operativo de su ordenador. Si es usuario de Windows seleccione la opción de descarga 32 bits o 64 bits según su sistema operativo. Para estar seguro de la versión de su sistema, en el explorador de archivos, diríjase a Este equipo, haga clic derecho y seleccione la opción Propiedades y revise la sección tipo de sistema.
  3. Una vez finalice la descarga, ejecute el archivo descargado, haciendo clic sobre el archivo.
  4. Siga los pasos de instalación en su ordenador.

Puede encontrar instrucciones más específicas de instalación en la página de descargas, y en este video tutorial.

Paso 2 - Descarga de datos

Descargue el archivo comprimido datos_geografia.zip, descomprímalo y extraiga el archivo datos_geografia.csv. El formato para cargar archivos de texto en QGIS puede ser .csv o .txt (separado por comas o tabulaciones).

Paso 3 - Descarga del proyecto

El Equipo Coordinador del SiB Colombia (EC- SiB) ha elaborado un proyecto en QGIS con capas geográficas de referencia para la validación geográfica de los datos. Descargue el proyecto de validación geográfica de QGIS, y guárdelo en una ubicación corta como Mis documentos o el Disco local (C:).

Cuando finalice la descarga ubique el archivo en su ordenador y descomprimalo. Dentro de la carpeta resultante ubique el archivo ValidacionGeoQGIS.qgs y ábralo haciendo doble clic o con clic derecho y siguiendo la ruta Abrir con > QGIS 3.10.

Paso 4 - Exploración del proyecto

Al ejecutar QGIS verá un entorno similar al siguiente (Fig. 1).

Figura 1. Entorno de trabajo en el proyecto de QGIS (v.3.10) de validación geográfica. A. Menú de herramientas. B. Panel de capas. C. Vista del mapa.

Contenido del proyecto en QGIS:

  • MGN_DPTO_POlITICO: división departamental de Colombia de acuerdo al Marco Geoestadístico Nacional del DANE.
  • MGN_MPIO_POLITICO: división municipal de Colombia de acuerdo al Marco Geoestadístico Nacional del DANE.
  • MGN_MPIO_Buffer_530m: buffer de 530 metros generado al rededor de los límites municipales para identificar registros que se encuentran muy cerca del límite municipal.
  • Capas de interés
    • RUNAP_202007: capa del Regitro Único Nacional de Áreas Protegidas.
    • RegionesMarítimas: división de las regiones marítimas de Colombia.
    • Planchas WGS84: consulta de planchas en escala 1:100.000.
    • Veredas de Colombia_2017: división veredal de Colombia.
    • World_Countries: capa de referencia general de países del mundo.
  • Mapas base:
    • Google Maps
    • OSM Black and white
    • OpenStreetMap

Paso 5 - Carga de los datos

5.1. Añadir capa de texto delimitado

Para cargar los datos descargados en el paso 2, diríjase al menú de QGIS y seleccione Layer > Add Layer > Add Delimited Text Layer (Fig. 2).

Figura 2. Pasos para carga de archivos de texto delimitados en QGIS.

5.2. Seleccione el archivo a validar

En la ventana emergente, haga clic en File Name y ubique el archivo datos_geografía.csv que guardó en el paso 2 (Fig. 3A).

5.3. Seleccione el tipo de archivo y delimitador de texto

QGIS llenará los campos de la ventana emergente de manera automática, sin embargo verifique que el formato del archivo corresponda con el tipo de archivo y delimitador usado, en este caso es CSV (Fig. 3B).

5.4. Revise la codificación

Observe si en la vista previa (Fig. 3F) los nombres de las entidades geográficas muestran problemas de codificación como símbolos de interrogación u otros reemplazando tildes y ‘eñes'. Si hay problemas ajuste en Encoding: la codificación (Fig. 3C), según su sistema operativo pruebe la opciones System (Windows), macintosh (Mac) o UTF-8 para cualquier sistema, hasta asegurarse que no hay problemas de codificación en la vista previa (Fig. 3F).

5.5. Seleccione las coordenadas decimales

En Geometry definitions seleccione Point coordinates y verifique que X field corresponde a decimalLongitude y la Y field a decimalLatitude del archivo (Fig. 3D).

5.6. Seleccione el sistema de referencia

En el campo Geometry CRS seleccione el sistema de referencia de coordenadas: WGS84 (World Geodetic System). Si no selecciona el sistema QGIS tomará por defecto el sistema usado en este proyecto (WGS84) (Fig. 3E). Para finalizar la carga del archivo haga clic en Add.

Figura 3. Pasos para cargar archivos de texto delimitado en QGIS. A. Ubicar el archivo de validación. B. formato del archivo tipo .csv. C. Selección de la codificación. D. Selección de campos de coordenadas. E. Selección del sistema de referencia. F. Vista previa de los datos a cargar.

Si realiza este ejercicio con sus propio conjunto de datos (Paso 7) es importante que conozca el sistema de referencia o datum.

5.7. Visualización de los datos

Una vez cargado el archivo, una nube de puntos se desplegará en la ventana de visualización de QGIS (Fig. 4).

Figura 4. Visualización de los datos en QGIS.

Paso 6. Validación geográfica

A continuación procedará a validar la coherencia entre la ubicación de las coordenadas y la geografía superior, para ello realizará un cruce geográfico entre los datos y la capa de Municipios de Colombia MGN_MPIO_POLITICO.

6.1. Intersección de datos y capas

Realice una intersección entre la capa de municipios y los datos, para ello seleccione de la barra de herramientas superior la opción Vector > Data Management Tools > Join Attributes by Location (Fig. 5).

Figura 5. Selección de la función Join Attributes by Location en el menú de herramientas.

En el menú emergente configure la intersección de las capas así (Fig. 6):

  • Input Layer: seleccione la capa de puntos que contiene sus coordenadasdatos_geografia.
  • Overlay Layer: seleccione la capa de municipios de Colombia MGN_MPIO_POLITICO.
  • Join type: seleccione la opción Take Attributes of the first located Feature.

Haga clic en Run.

Figura 6. Configuracuón de la intersección de las capas.

6.2. Exploración de los resultados

Obtendrá una nueva capa llamada Joined_layer con la intersección de los datos y la capa de municipios, revise que esta se encuentre en el panel de capas Layers. Abra la tabla de atributos de esta capa haciendo clic derecho sobre la capa y elija la opción Open Attribute Table (Fig. 7).

Figura 7. Acceder a la tabla de atributos de la capa resultante.

En la tabla de atributos encontrará los datos ingresados y unas nuevas columnas con los nombres y códigos del municipio y departamento de acuerdo a la ubicación de las coordenadas respecto a la capa de municipios (Fig. 8).

Figura 8. Detalle de la tabla de atributos de la capa resultante de la unión.

6.3. Validación de los municipios

Para comparar los nombres sugeridos desde la capa y los nombres documentados en los datos, abra la calculadora de campos (Field Calculator) haciendo clic en el icono del ábaco en la barra de herramientas de la tabla de atributos (Fig. 9 ).

Figura 9. Selección de la calculadora de campos desde el menú de herramientas de la tabla de atributos.

  • Una vez en la calculadora de campos ( Field calculator), en Output field Name asigne countyValidation como el nombre de la columna (Fig. 10).

  • En la caja de dialogo Expression digite el siguiente comando:

     if( "county"  =  "suggestedC" ,'1',if("county" is null, '','0'))
    

    Este comando condicional evalua si el campo county está vacío, si está vacío el campo countyValidation queda vacío, de no estar vacío revisa que sea igual que el campo suggestedC, si ambos campos son iguales lo documenta como 1 que significa que la geografía superior coincide con la coordenada, sino se documenta como 0.

  • Finalmente, de clic en OK (Fig. 10).

Figura 10. Documentación de la calculadora de campos para obtener un campo con la validación geográfica del municipio (county).

En la tabla de atributos verá una nueva columna countyValidation con el resultado de la validación geográfica (Fig. 11).

Interpretación de los resultados

  • 1: El departamento o municipio documentados en stateProvince o county coinciden con el departamento o municipio donde se ubica la coordenada.
  • 0: El departamento o municipio documentados en stateProvince o county NO coinciden con el departamento o municipio donde se ubica la coordenada.
  • NULL o vacío: NO había un stateProvince o county documentados por lo tanto no se realizó la validación, este resultado también se obtiene si las coordenadas caen fuera de los límites de Colombia.

Figura 11. Verificación de resultados de la creación del campo con la validación del municipio (county).

6.4. Validación de los departamentos

Repita el paso 6.3. para la validación del departamento. Cree un nuevo campo para esta validación denominado stateProvinceValidation y utilice el siguiente comando (Fig. 12).

   if( "stateProvince"  =  "suggestedS" ,'1',if("stateProvince" is null, '','0')) 

Figura 12. Documentación de la calculadora de campos para obtener un campo con la validación geográfica del departamento.

6.5. Visualización de la validación

Genere un filtro para visualizar los datos donde la ubicación de la coordenada y la geografía superior no coinciden (0's):

  1. Abra nuevamente la tabla de atributos de la capa Joined_layer
  2. En la parte inferior de la tabla de atributos haga clic en el botón Show all features > Field filter > countyValidation (Fig. 13).

    Figura 13. Filtro de campos a partir de la tabla de atributos.

  3. Se abrirá un cuadro de diálogo en la parte inferior de la tabla de atributos, digite un cero (0) para filtrar los datos con inconsistencias (Fig. 14).

    Figura 14. Filtro de campos a partir de la tabla de atributos.

  4. En la parte superior de la tabla de atributos verá el número de registros biológicos filtrados. Seleccione la esquina superior izquierda de los datos como se muestra en la Fig. 15 para seleccionarlos.

    Figura 15. Selección y verificación de resultados del filtro a partir de resultados de la validación del campo countyValidation.

  5. Minimice la tabla de atributos, verá los puntos con inconsistencias (0's) seleccionados en la pantalla de visualización del mapa (Fig. 16).

    Figura 16. Visualización de los registros biológicos seleccionados (0's) donde la ubicación de las coordenadas no coincide con con el municipio documentado en el elemento county (blancos tachados con una “x”).

6.6. Exporte el resultado de la validación

Por último guarde el archivo de validación en su equipo:

  1. Clic derecho sobre la capa resultante y siga la ruta Joined_layer > Export > Save feature as (Fig. 17).

    Figura 17. Opciones para exportar el resultado de la validación geográfica en formato Excel.

  2. En la ventana emergente seleccione el formato MS Office Open XML [XLSX] . En File name ubique la carpeta donde quiere guardar el resultado y luego haga clic en Ok (Fig. 18).

    Figura 18. Documentación de ventana emergente para exportar resultados de la validación geográfica en formato Excel.

  3. Abra el archivo excel con el resultado de la validación, aplique filtros en las columnas countyValidation y stateProvinceValidation.

    :thinking: ¿Puede identificar los errores? Uno de los errores presentes en el cojunto de datos de prueba -y que es muy común- son los errores de tipeo en los nombres del los departamentos y municipios, por este motivo aunque su municipio coincida con la ubicación de la coordenada este proceso de validaciónpuede detectar el error de tipeo en la documentación de los elementos stateProvince y county. Por ejemplo fíjese en el municipio Abejorrral.

Para los fines de este ejercicio, que está enfocado en validación, no es necesario corregir los errores identificados en la validación geográfica.

Paso 7 - Verificación del resultado

Compare sus resultados con el siguiente archivo validado según las definiciones del estándar, verifique en que acertó y que puede mejorar.

¿Qué diferencias encontró con sus resultados?

Paso 8 - Datos propios

Si tiene datos propios pruebe validarlos siguiendo los pasos de este laboratorio.


¡Felicitaciones! :raised_hands: Ha mejorado la calidad de su conjunto de datos.


Atribución y uso de los laboratorios

La licencia CC-BY te permite usar, redistribuir y construir sobre estos contenidos libremente. :open_hands: Queremos que compartas estos laboratorios y que juntos logremos datos sobre biodiversidad de mejor calidad.

Citación sugerida

Plata C., Ortíz R., Marentes E. (2021). Laboratorio de datos, Ciclo de formación. Consultado a través del SiB Colombia. Disponible en https://sib-colombia.github.io/Formacion/



Fuentes:

  • Departamento Administrativo Nacional de Estadística DANE (2018), Marco Geoestadístico Nacional, Escala: No definida. Datum: MAGNA-SIRGAS), Recuperado de: https://geoportal.dane.gov.co/servicios/descarga-y-metadatos/descarga-mgn-marco-geoestadistico-nacional/

  • Parques Nacionales Naturales de Colombia (2020), Límite de los Parques Nacionales Naturales de Colombia, Multiescala (1:1.000 y 1:100.000). Datum: MAGNA-SIRGAS, Recuperado de: http://mapas.parquesnacionales.gov.co/services/pnn/ows?service=WFS&version=1.0.0&request=GetFeature&typeName=pnn:runap2&maxFeatures=10000&outputFormat=SHAPE-ZIP. Fecha. 2020-07-08.

  • Departamento Administrativo Nacional de Estadística (DANE). Descarga Nivel de referencia de veredas. Recuperado de:https://geoportal.dane.gov.co/servicios/descarga-y-metadatos/descarga-nivel-de-referencia-de-veredas/, fecha de consulta: 2020-02-24.

  • Marco Geoestadístico Nacional - Guía de descarga y visualización