Los organismos de normalización de la información geográfica y su implementación en el Gestor Universal de Metadatos Geoespaciales (GeM+).

El COMITÉ EUROPÉEN DE NORMALISATION

El Comité Européen de Normalisation (en adelante CEN) tiene como función promover la estandarización en todos los ámbitos dentro del espacio europeo. Lo forman las entidades nacionales de normalización de los siguientes países: Austria, Bélgica, República Checa, Dinamarca, Finlandia, Francia, Alemania, Grecia, Islandia, Irlanda, Italia, Luxemburgo, Países Bajos, Noruega, Portugal, España, Suecia, Suiza y Reino Unido, así como las siguientes asociaciones representantes del sector industrial:

A finales de octubre de 1991 el CEN creó el grupo de trabajo CEN/TC 287 (Technical Committee) responsable de la estandarización en el marco de la información geográfica. La normativa surgida de él, denominada EN (European Norm), sustituirá a la que hasta entonces regía en los países miembros antes mencionados.

El Comité Técnico 287 (TC 287) denominado Geographic Information, ha publicado un total de 12 documentos con carácter prenormativo (ENV o normas experimentales). Estos documentos no son públicos. Es necesario dirigirse al organismo nacional correspondiente, en nuestro caso AENOR (Asociación Española de Normalización y Certificación), para conseguir una copia en papel, previo pago del coste establecido. No están disponibles en formato digital ni en Internet. Está previsto que, una vez pasen a ser norma nacional (UNE), estos documentos sean traducidos del inglés al castellano, pero nosotros todavía hemos utilizado las versiones en inglés.

El Gestor Universal de Metadatos Geoespaciales (en adelante GeM+) recoge las especificaciones establecidas en los siguientes documentos:

Otras normas que, por su contenido, también afectan a la normalización de las metadatos del GeM+, son estos:

Puede consultar una reseña del contenido de cada uno de ellos hecha por el mismo Comité.

ESTRUCTURA DEL DOCUMENTO DE METADATOS DEL CEN

ElEuropean Prestandard (ENV) 12657, Geographic Information - Data description - Metadata, fue aprobado por el CEN en Octubre de 1998. Su período de validez es inicialmente de tres años. Después de los dos primeros años los integrantes del CEN son convocados a dar sus opiniones, particularmente en lo que afecte a la conversión de este documento prenormativo a norma europea. Está previsto, pues, para octubre de 2000. El período inicial de tres años de validez finaliza en octubre de 2001.

Se estructura en cuatro capítulos y tres anexos. El listado de los metadatos se recoge en el capítulo 4, en concreto en el punto 4.6 Element of metadata for describing geographic datasets. El Anexo A tiene carácter normativo y es la descripción de las metadatos en lenguaje EXPRESS. El lenguaje EXPRESS está recogido en la ISO 10303-11:1994 y se creó para definir entidades mediante sus atributos, así como la relación entre ellas. Los anexos B y C son informativos. El primero es de nuevo la descripción de los metadatos en EXPRESS-G, es decir, en forma de diagrama, mientras que el anexo C es el listado completo de los campos, con su descripción, la restricción (obligatoriedad o no), la cardinalidad y el tipo. Este último se limita a decir si son string o date, prácticamente (no pretende ser exhaustivo).

Durante el desarrollo de GeM+ hemos tenido especial interés en aclarar la verdadera utilidad del lenguaje EXPRESS, ya que parecía en exceso complicado. Hemos podido confirmar la tendencia, liderada por la ISO, de utilizar el UNIFIED MODELLING LANGUAGE (UML) para los esquemas conceptuales, y XML como formato de intercambio.

El documento comienza dando una sencilla y clásica definición de los metadatos ('fecha about datasets') y establece, como objetivo, la especificación de los datos que documentarán las bases geográficas (los datasets), las cuales incluyen información sobre el contenido, la representación, la extensión (geométrica y temporal), la referencia espacial, la calidad y la administración. También anuncia la definición del contenido mínimo obligado (mandatory) que deben tener los metadatos e incluye un glosario con las definiciones de los términos empleados.

No proviene de instrucciones o técnicas por la aplicación de su esquema porque, según justifica, ésta no es su finalidad. Sin embargo, se autodefine como diseñado principalmente para definir datos digitales, pero aclarando que sus principios son también aplicables para describir bases geográficas en otros formatos, como por ejemplo en papel.

Hay dos tipos de metadatos: obligatorias (mandatory) y opcionales (optional). Las obligatorias están indicadas antecediéndolas por la palabra Shall y las opcionales por May.

Porque un conjunto de metadatos sea conforme con esta normativa, debe incluir los claves definidas como obligatorias en los siguientes capítulos:

y optativamente informar de las contenidas en los siguientes:

Todas las fechas que se dan en texto serán recogidas utilizando la norma EN 28601, es decir, Año-Mes-Día (YYYY-MM-DD).

El lenguaje utilizado por los textos en la descripción de las bases será identificado por los códigos definidos en ISO639. Cuando convenga, podrán repetirse en otras lenguas.

El GeM+ está basado en el estándar europeo de metadatos ya que incorpora cómo obligatorios todos los contenidos que el CEN considera como tal, pero también es normativo según el estándar estadounidense, ya que incorpora cómo obligatorios todos los contenidos que el FGDC consideraMandatory o Mandatory if applicable.

[Al principio]

El FEDERAL GEOGRAPHIC DATA COMMITTEE

El Federal Geographic Data Committee (en adelante FGDC) es el organismo del gobierno de los Estados Unidos de América encargado de desarrollar la National Spatial Data Infrastructure en aquellos aspectos que afecten la distribución de los datos geográficos. En junio de 1994 se aprobó el estándar de metadatos para datos geográficos digitales, the Content Standard for Digital Geospatial Metadata, cuya última revisión se encuentra accesible en la página http://www.fgdc.gov/metadata/csdgm/. También pueden consultar en formato pdf la versión que se ha utilizado para adaptar el GeM+.

Estructura del Estándar

El estándar se organiza con una jerarquía de datos elementales y elementos compuestos que definen el contenido de los metadatos que documentan una base de datos digitales geográficas. El punto de partida son los "metadatos" (sección 0). El elemento compuesto "metadato" se compone de otros elementos compuestos que, a su vez, representan aspectos diferentes de la base. Cada uno de estos elementos tiene una sección numerada en el estándar. En cada sección numerada, estos elementos compuestos se definen por otros elementos compuestos y datos elementales. La sección "contact information" es una sección especial que especifica los datos de contacto de personas, particulares y organizaciones. Otras secciones hacen uso de esta, que se define una sola vez.

*Otras secciones comodín son Citation Information y Time Period Information.*

Elementos Compuestos (Compound Elements)

Un elemento compuesto es un grupo de datos elementales y otros elementos compuestos. Todos los elementos compuestos están descritos por datos elementales, o bien, directamente, o bien, a través de los elementos compuestos intermedios. Los elementos compuestos representan conceptos de mayor nivel que no se pueden representar por datos elementales individuales. La forma de la definición de los elementos compuestos es:

Compound element name -- definition.
Type: compound
Short Name:

El "type" (tipo) "compound" identifica exclusivamente a los elementos compuestos en los listados de términos y definiciones. Se incluyen nombres abreviados de ocho, o menos, caracteres alfabéticos para facilitar la implementación del estándar.

Datos elementales (Data Elements)

Un dato elemental es un dato, lógicamente primitivo. La entrada de un dato elemental incluye el nombre del dato, su definición, una descripción de los valores que pueden ser asignados al dato elemental, y un nombre abreviado del dato elemental. La forma de la definición de los datos elementales es:

Data element name -- definition.
Type:
Domain:
Short Name:

La información sobre los valores de los datos elementales incluye una descripción del tipo de valores, y una descripción del rango de valores válidos. El tipo de elemento describe el tipo de valor a proporcionar. Las opciones son: "integer" para números enteros, "real" para números reales, "text" para caracteres ASCII, "date" para el día del año, y "time" para la hora del día.

El "domain" (rango) propone los valores válidos que pueden asignarse a cada dato elemental. El rango puede especificar una lista de valores válidos, referencias a listas de valores válidos, o límites de un rango de valores que pueden asignarse a los datos elementales.

El estándar categoriza los elementos como "mandatory", "mandatory-if-applicable", u "optional" (obligatorio, obligatorio si es aplicable, opcional):

La opcionalidad de una sección o de un elemento compuesto siempre tiene prioridad sobre la opcionalidad de los elementos contenidos en esa sección o elemento. Una vez que el productor de la base reconoce la aplicabilidad de la sección o del elemento compuesto, es cuando debe interpretar los elementos subordinados.

Reglas de producción (Production Rules)

Una regla de producción especifica la relación entre un elemento compuesto, los datos elementales y otros elementos compuestos (de rango inferior). Cada regla de producción tiene una parte izquierda (identifier - identificador) y una parte derecha (expression - expresión) vinculadas por el símbolo "=", indicando que el término de la izquierda se sustituye por, o produce, el término de la parte derecha. Los términos de la parte derecha son elementos compuestos o datos elementales individuales. A partir de las sustituciones realizadas con los términos emparejados en las reglas de producción es posible explicar los conceptos de mayor nivel mediante datos elementales. Los símbolos utilizados en las reglas de producción tienen el significado que se detalla a continuación:

= se sustituye por, produce, consiste en
+ y
[|] selection - selecciona un término de la lista de términos adjuntos (exclusive or). Los términos se separan por "|"
m{}n iteration - el/los término/s adjunto/s se repite/n de "m" hasta "n" veces
() optional - el/los término/s adjunto/s es/son opcional/es

El productor puede decidir si proporciona o no la información sólo si los términos están entre paréntesis.

El concepto "mandatory if applicable" (obligatorio si es aplicable) tuvo que inventarse porque existen gran variedad de maneras de producir y distribuir datos geográficos, debido a que no todos los datos geográficos tienen las mismas características y por el hecho de que los detalles de bases en proyecto o producción no siempre se conocen. Este concepto significa que si una base presenta una característica determinada (o se sabe que una base en producción o en proyecto la presentará), el productor debe proporcionar la información necesaria para describir esa característica. Este concepto se define en la regla de producción:

0{ term }1

El contenido se estructura de la siguiente modo:

Identification Information Mandatory
Data Quality Information Mandatory if applicable
Spatial Data Organization Information Mandatory if applicable
Spatial Reference Information Mandatory if applicable
Entity and Attribute Information Mandatory if applicable
Distribution Information Mandatory if applicable
Metadata Reference Information Mandatory


Consulte un cuadro resumen de equivalencias entre los estándares del GeM+, del CEN y del FGDC

[Al principio]

La INTERNATIONAL ORGANITZATION FOR STANDARDIZATION

De la normalización a nivel internacional se encarga la International Organization for Standardization (en adelante ISO). Toma su nombre de un juego de palabras con un prefijo griego que significa 'igual en cualquier aspecto', no de sus iniciales reales. Está ubicada en Ginebra e integra los organismos nacionales de normalización de más de 80 países, entre ellos el American National Standards Institute (ANSI) en EE. UU. o AENOR en España, por citar solo dos ejemplos conocidos.

ISO ha creado el Comité Técnico TC 211 Geographic information/Geomatics. Su trabajo se basa en los estándares previamente desarrollados por el FGDC, el CEN y el Open Geospatial Consortium.

El GeM+ se mantiene atento a la publicación de las normas ISO para adaptar su contenido en todo lo que sea normativo, con la seguridad de que los cambios a realizar no afectarán sustancialmente lo que ya está implementado proveniente de la normativa europea y norteamericana.

ISO 19115:2003 Geographic information - Metadata

La norma ISO 19115:2003 Geographic information - Metadata, perteneciente a la familia de normas internacionales ISO 19100 para Información Geográfica desarrollada por el Comité Técnico 211 (Geomatics/Geographic Information) dentro de la Organización de Normalización Internacional (ISO), ha sido adoptada como Norma Europea por el CEN/TC287 y como norma española por AEN/CNT148. Define el esquema requerido para describir la información y los servicios geográficos. Proporciona información sobre la identificación, la extensión, la calidad, el esquema espacial y temporal, la referencia espacial y la distribución de datos geográficos digitales. Es aplicable a:

Esta norma incluye 409 elementos, pero se ha establecido un mínimo básico de elementos que sirven para definir un conjunto de datos con el propósito de establecer mínimos para facilitar el descubrimiento, acceso, transferencia y utilización de los datos. Estos elementos se definen como el núcleo o Core, formado por elementos clasificados en obligatorios (O), opcionales (Op) y Condicionales (C).

Proporciona una estructura para describir la información geográfica mediante elementos de metadatos y establece una terminología común para los mismos. Para poder desarrollar su implementación se utiliza la norma ISO 19139.

El GeM+ está organizado basándose en los componentes de la información espacial, temporal y temática.

ISO/TS 19139:2007 Geographic information - Metadata - XML schema implementation

La norma ISO/TS 19139:2007, Geographic information - Metadata - XML schema implementation define la codificación Geographic MetaData XML (gmd), una implementación de esquema XML derivada de la norma ISO 19115. Esta norma define un conjunto de esquemas en XML que describen las metadatos asociadas a cada nivel de información, permitiendo así su descripción, asegurar la validación y posterior intercambio. En el siguiente enlace están disponibles los esquemas definidos http://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19139_Schemas/

OPEN GEOSPATIAL CONSORTIUM

El Open Geospatial Consortium (OGC) es una organización internacional fundada en 1994. Actualmente está formada por más de 500 miembros, empresas, agencias gubernamentales, organizaciones de investigación y universidades impulsadas para generar información geoespacial (localización) y servicios siguiendo los principios FAIR (Findable, Accessible, Interoperable and Reusable), es decir, que puedan encontrarse, que sean accesibles, interoperables y reutilizables. OGC participa, a la vez, en las diferentes iniciativas de estandarización, entre las que destaca especialmente la ISO TC 211.

El OGC participa, a la vez, en las diferentes iniciativas de estandarización, entre las que destaca especialmente la ISO TC 211.

Consideraciones sobre el OGC Abstract specification Topic 11: Metadata

La versión disponible en la web del OGC se actualizó a la última versión del estándar de metadatos ISO, el 21 de septiembre de 2016. Antes de esta fecha, este tema era el mismo que ISO 19115:2003. El trabajo del OGC sobre metadatos se basa íntegramente en lo que paralelamente desarrolla la ISO, que a su vez hereda el trabajo realizado en la sede del CEN y del FGDC.

La Directiva Europea INSPIRE

El GeM+ es conforme a las normas de implementación de metadatos de la normativa INSPIRE.

La Comisión Europea establece la Directiva INSPIRE (Infrastructure for Spatial Information in Europe). Fue desarrollada en colaboración con los Estados miembros y países en proceso de adhesión, con el objetivo de poner a disposición la información necesaria para la gestión de políticas ambientales de la Unión Europea. Aprobada el 14 de marzo de 2017 (Directiva 2007/2/CE).


Otras iniciativas nacionales

MIGRA v.1: Mecanismo de Intercambio de Información Geográfica Relacional formado por Agregación.

Nació por iniciativa de la Asociación Española de Normalización y Certificación (AENOR) y la Comisión Nacional para la Cooperación entre las Administraciones Públicas en el ámbito de los Sistemas y Tecnologías de la Información (COAXI), que agrupa al Ministerio de Administraciones Públicas (MAP) y la Federación Española de Municipios y Provincias (FEMP).

Se desarrolló durante los meses de enero-septiembre de 1996, se convirtió en norma española experimental (UNE 148001:1998 EX) y se anuló en 2006. BOE-A-2007-469.

Características principales:

MIGRA es un estándar de transferencia de datos geográficos digitales, que incluye:

Sólo es aplicable a datos vectoriales. Los rasters no se consideran. Se mencionan en la introducción para indicar que ya existen formatos comerciales suficientemente extendidos como para que la transferencia de datos no sea un problema.

Tampoco considera la referenciación indirecta, sino únicamente los sistemas de referencia basados en coordenadas.

No incluye ninguna forma de realizar consultas a un SIG y transferir las posibles respuestas, ni ningún mecanismo para transferir actualizaciones.

Utiliza el lenguaje EXPRESS (ISO 10303-11:1993) -adaptado por el CEN para la definición del modelo conceptual de datos-, pero más para mantener la coherencia con las directrices europeas que por las características de este lenguaje, que no lo hacen el más idóneo para la difusión e implementación de las directrices de MIGRA, como expresan claramente sus autores en la introducción al modelo conceptual en EXPRESS.

El modelo de datos de MIGRA contempla cuatro niveles de estructuración:

La norma incluye un ejemplo de cada nivel de estructuración.

El catálogo de elementos de MIGRA está formado por:

Se han recopilado por agregación las clases de elementos utilizadas por el Instituto Geográfico Nacional (IGN) y la Dirección General del Catastro, más las incorporadas por la Federación Española de Municipios y Provincias (FEMP).

El criterio de codificación sigue un modelo jerárquico con tres niveles: Tema, Grupo y Subgrupo.

El modelo físico de MIGRA especifica que, a excepción del de metadatos, todos los ficheros y todos los campos son de longitud de registro fija y se trata de tablas relacionales en 3ª Forma Normal. Esta última afirmación sirve para garantizar que las tablas no contienen redundancia de datos, y que en su modificación no se podrán producir anomalías durante la actualización, el borrado y la inserción de datos.

El contenido de los campos en los ficheros en formato MIGRA podrá ser de los siguientes tipos:

En caso de que un campo contenga cualquiera de los dos últimos casos, se aplicará la siguiente norma:

Los metadatos de MIGRA

La novedad de MIGRA respecto a la normativa del CEN es que MIGRA sí define un formato para los ficheros de metadatos. En este formato existen dos clases de registros:

Aunque MIGRA no lo explicita, sigue fielmente el formato de los ficheros INI de Windows, de la misma manera que lo hace GeM+, con las dos excepciones siguientes:

Las abreviaturas NA y ND se usarán cuando sean aplicables, de manera que ninguna variable tenga como valor el carácter en blanco.

MIGRA no especifica ningún nivel de obligatoriedad ni indicación del tipo de cardinalidad de las secciones y variables en las que organiza los metadatos. Las secciones son las siguientes:

[PRODUCTOR]
[DISTRIBUIDOR] (si es distinto del Productor)
[DATOS]
[CONTENIDO]
[NOTAS]

Dentro de la sección [CONTENIDO] se encuentra la información referente a los atributos temáticos y a la calidad. A continuación se hace un pequeño resumen.

Los atributos temáticos

Se desglosan en dos subsecciones:

[FICHERO_DE_ATRIBUTOS_1]
Es la descripción física de los ficheros de atributos: longitud y número de registros, tamaño en bytes, etc.

[ATRIBUTOS_DEL_FICHERO_1]
Es la información específica de cada atributo:

La calidad

Los criterios de calidad aplicables a un intercambio de datos, según MIGRA, son los referidos a:

Los criterios que establecen la calidad de los datos son:

[Al principio]