En 2003, la Subdirección General de Coordinación Bibliotecaria (SGCB) lanzó un proyecto nacional de digitalización cooperativa en España. Para garantizar la interoperabilidad y acceso a las obras digitalizadas, se adoptó el protocolo OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting). Este protocolo permite la recolección periódica y automatizada de metadatos de repositorios digitales, asegurando que los proveedores de servicios puedan acceder a la información actualizada de forma eficaz.

El protocolo OAI-PMH es un estándar que facilita la interoperabilidad entre diferentes repositorios digitales, permitiendo la recolección y distribución de metadatos mediante solicitudes HTTP y respuestas en formato XML. Este enfoque garantiza que los datos estén disponibles para ser consultados y utilizados por otros servicios, incrementando el acceso y visibilidad de las obras digitalizadas.

Funcionamiento del Protocolo OAI-PMH

El protocolo OAI-PMH se basa en el intercambio de solicitudes HTTP y respuestas estructuradas en XML. Los repositorios que implementan este protocolo exponen sus metadatos a través de una serie de verbos (comandos), que permiten a los recolectores de metadatos obtener información sobre los registros disponibles en el repositorio. Los verbos principales utilizados en este proceso son:

  • GetRecord. Utilizado para recuperar un registro concreto. Necesita dos argumentos: identificador del registro pedido y especificación del formato bibliográfico en que se debe devolver.
  • Identify. Utilizado para recuperar información sobre el servidor: nombre, versión del protocolo que utiliza, dirección del administrador, etc.
  • ListIdentifiers. Recupera los encabezamientos de los registros, en lugar de los registros completos. Permite argumentos como el rango de fechas entre los que queremos recuperar los datos.
  • ListRecords. Igual que el anterior pero recupera los registros completos.
  • ListSets. Recupera un conjunto de registros. Estos conjuntos son creados opcionalmente por el servidor para facilitar una recuperación selectiva de los registros. Sería una clasificación de los contenidos según diferentes entradas. Un cliente puede pedir que se recuperen solo los registros pertenecientes a una determinada clase. Los conjuntos pueden ser simples listas o estructuras jerárquicas.
  • ListMetadataFormats. Devuelve la lista de formatos bibliográficos que utiliza el servidor.

Este conjunto de verbos permite una amplia flexibilidad en la recuperación de datos, proporcionando una capa de interoperabilidad entre diferentes sistemas y repositorios. El sistema implementado soporta varios formatos de metadatos, lo que permite una mayor flexibilidad y compatibilidad con diferentes estándares. Los formatos soportados entre otros son:

  1. MARC21 (marcxml): Un formato estándar para la representación y comunicación de información bibliográfica y relacionada.
  2. Dublin Core no cualificado (oai_dc): Un conjunto simple y estandarizado de elementos de metadatos para describir una amplia gama de recursos.
  3. Europeana Data Model (edm): Un modelo de datos desarrollado por Europeana para la agregación de metadatos de objetos culturales.

Implementación para La Fundación Fayón Cultural y Patrimonial

Para implementar el protocolo OAI-PMH en La Fundación Fayón, se configuró el servidor para que procese solicitudes HTTP y genere respuestas XML que cumplan con el estándar OAI-PMH. La correcta configuración del servidor es esencial para asegurar que las solicitudes sean interpretadas y respondidas conforme a los requerimientos del protocolo.

Para el desarrollo de este servidor se llevó a cabo utilizando PHP como lenguaje principal para procesar solicitudes del protocolo. Se pueden destacar varios puntos de la lógica del servidor que se debe tener para su correcto funcionamiento como pueden ser; Una lógica para conectarte a la base de datos y recuperar los datos necesarios de cada solicitud, métodos para cada verbo OAI-PMH explicados anteriormente y el desarrollo de funciones que generan respuestas en formato XML conforme al esquema OAI-PMH.

Una vez implementado el protocolo, se realizaron pruebas exhaustivas para validar que el servidor respondiera correctamente a cada solicitud OAI-PMH y que los metadatos se expusieran de manera adecuada. Para garantizar el cumplimiento del estándar, utilizamos el validador oficial de OAI-PMH. Este validador permite verificar las URLs de nuestro repositorio y proporciona un reporte detallado de cualquier error encontrado, facilitando la corrección del código si fuese necesario.

En la página oficial del protocolo encontramos también su documentación con consejos y ejemplos que sirvieron de ayuda para la realización de este proyecto. El proceso de validación incluyó:

  • Pruebas de Verificación de Verbos: Aseguramos que todos los verbos del protocolo respondieran de forma precisa y oportuna.
  • Validación de Respuestas XML: Confirmamos que el formato de las respuestas XML cumpliera con las especificaciones del protocolo.
  • Corrección de Errores: Cualquier error identificado durante la validación fue corregido para cumplir con los estándares.

Aquí encontrarás información técnica, datos del repositorio y al final de la web ejemplos de consultas sobre las obras de Fayón en distintos formatos.

Para más información, visita la página oficial de OAI-PMH.