Conversión Fechas

Objetivo

Realizar la transformación y estandarización de fechas en distintos formatos, al formato ISO 8601 (AAAA-MM-DD), de manera automática y masiva.

Sobre la herramienta

La herramienta Date parsing, desarrollada por Canadensys (nodo GBIF Canadá), permite transformar y estandarizar fechas de forma masiva, de acuerdo al estándar ISO 8601: AAAA-MM-DD, que es el requerido en el estándar Darwin Core.

Enlace http://data.canadensys.net/tools/dates

Requerimientos

  • Para realizar este ejercicio debe contar con un programa procesador de archivos de texto como Excel.

Archivo de trabajo

Descargue el archivo datos_canadensys.xlsx para realizar el laboratorio


Paso 1 - Ingreso

Ingrese a la aplicación en línea Date parsing. Revise cuidadosamente las opciones disponibles para ingresar las fechas.

Nota: las fechas pueden estar escritas en múltiples formatos siempre y cuando no hayan ambiguedades, por ejemplo que el año sea imposible de distinguir del mes y el día. Opcionalmente las fechas pueden ir precedidas por un identificador propio seguido por una tabulación o una barra vertical.

Ejemplos de valores de entrada:

Jun 13, 2008 15 Jan 2011 2009 IV 02 2 VII 1986 1 | 1999/02/24 2 | 02/17/1921

Paso 2 - Carga de las fechas

Abra en Excel el archivo datos_canadensys.xlsx y busque la información temporal, encontrará la columna verbatimEventDate (fecha en el formato original en el cual fue tomada) con fechas de colecta en formatos diferentes.

Seleccione la columna verbatimEventDate que corresponde a la fecha del evento y cópiela sin el encabezado (Fig. 1).

Figura 1. Seleccion y copia de las fechas originales verbatimEventDate

Ingrese a la aplicación Date parsing y pegue los datos previamente copiados. Luego de clic en Submit para iniciar la conversión de fechas (Fig. 2).

Figura 2. Fechas originales en diversos formatos ingresadas en la herramienta

Paso 3 - Resultados

Las fechas originales ingresadas apareceran en la columna original (que corresponde al elmento verbatimEventDate) junto con 4 nuevas columas: year, month, day correspondintes al estándar DwC y una columna denominada ISO 8601, que es el resultado de la estandarización y corresponderá al elemento DwC eventDate (Fig. 3).

Figura 3. Elementos resultado del uso de la herramienta

Cuando las fechas son ambiguas la herramienta no puede reconocer el formato de la fecha y muesta en rojo la fecha (Fig. 4).

Esto ocurre cuando no es posible identificar los componentes (año, mes, día) con claridad por ejemplo con la fecha 02/05/07 ¿El año es 2002 o 2007?. Si se presenta este tipo de ambiguedad, es necesario hacer una corrección manual basado en el contexto de los datos.

También se pueden generar inconvenientes cuando hay convinaciones de texto y número ya que la herramienta esta construida en ingles.

Figura 4. Ejemplo de fechas ambiguas donde la herramienta no reconoce el formato y no puede hacer la transformación

Paso 4 - Copiar resultados

En el archivo de Excel datos_canadensys.xlsx, agregue 5 columnas a la izquierda de la columna con las fechas originales. Para esto haga clic en el encabezado de la columna verbatimEventDate > clic derecho > Insertar. Repita este paso 4 veces más (Fig. 5).

Figura 5. Proceso para insertar nuevas columnas en Excel

Desde la herramienta Date Parsisng seleccione y copie con le mouse toda la tabla arrojada como resultado, incluyendo encabezado (Fig. 6).

Figura 6. Selección y copia de los resultados

Antes de pegar los datos, asegurese de asignarle el formato de texto a las columnas que creo en el documento de Excel (Fig. 7)

Figura 7. Configuración del formato de las columnas a tipo texto

Pegue la tabla copiada en el archivo Excel con los siguientes pasos:

1) Ubíquese sobre las celdas insertadas en el paso 5 (Fig. 8A). 2) De clic en Inicio en el menú superior y seleccione Pegar > Pegado especial (Fig. 8B). 3) En el menú de pegado especial seleccione Texto y luego Aceptar (Fig. 8C).

El pegado especial en formato texto es indispensable para que Excel no haga interpretaciones erróneas sobre las fechas ya estandarizadas. Si no se realiza, Excel revertirá las fechas a otro formato y usted perdera su trabajo :sob:

Figura 8. Pasos para insertar las fechas copiadas con formato texto.

El pegado especial en formato texto es indispensable para que Excel no haga interpretaciones erróneas sobre las fechas ya estandarizadas. Si no se realiza, Excel revertirá las fechas a otro formato y usted perdera su trabajo :sob:

Verá las columnas incorporadas en el Excel (Fig. 9). Sin embargo note que la columna con la fecha del evento original se ha duplicado.

Figura 9. Resultados de las fechas en la hoja de Excel

Para finalizar la estandarización debe renombrar y eliminar algunas columnas.

  • Eliminar la columna original
  • Renombrar la columna ISO 8601, por eventDate

Recuerde que puede aplicar este procedimiento a todos los elementos asociados a fechas en el estándar DwC como dateIdentified (Fecha de identificación), georeferencedDate (Fecha de georreferenciación), etc.

Paso 5 - Datos propios

Si tiene datos propios que desee publicar, intente convertir las fechas al formato ISO 8601 siguiendo los pasos de este laboratorio.


¡Felicitaciones! :raised_hands: Terminó la conversión de las fechas del conjunto de datos a el estándar ISO 8601.