Desarrollo de un protocolo validado de integración e interoperabilidad entre el Repositorio institucional de la ANID y repositorios institucionales universitarios

28 Jul 2023 (modified: 01 Aug 2023)InvestinOpen 2023 OI Fund SubmissionEveryoneRevisionsBibTeX
Funding Area: Critical shared infrastructure / Infraestructura compartida critica
Problem Statement: La ANID https://anid.cl/ es la agencia del Estado que ejecuta instrumentos que desarrollan la investigación en Chile. Desde 2012 tiene un repositorio institucional https://repositorio.anid.cl/home como servicio digital estable, no comercial y sin fines de lucro que gestiona, difunde y preserva en acceso abierto la producción científica nacional obtenida por proyectos financiados con fondos públicos; es el nodo chileno que LA Referencia https://www.lareferencia.info/es/ cosecha. Actualmente ANID trabaja con universidades que tienen sus propios repositorios (plataformas abiertas, no comerciales y sin fines de lucro) para construir el nodo nacional de repositorios. El mayor desafío tecnológico es lograr la integración e interoperabilidad entre el Repositorio ANID y los repositorios universitarios. Es necesario realizar un piloto inicial de protocolo validado de integración e interoperabilidad (hoy no existente) con un repositorio universitario para evaluar viabilidad, duración, costos, desafíos y mejoras de diseño (tener una experiencia documentada replicable y transferible) antes de ejecutar de un piloto avanzado que involucre otras diez instituciones. Es un trabajo de colaboración inter-institucional. No contar con el protocolo propuesto y el nodo nacional de repositorios (a futuro) reduce la visibilidad de los resultados de investigación y la re-utilización del conocimiento por parte de investigadores, instituciones de educación e investigación y comunidad CTCI en general.
Proposed Activities: Seis meses duración del proyecto, usando datos reales y documentando procesos. 1. Interconectividad, sintaxis y semántica: durante el primer mes, definir los protocolos a utilizar para el intercambio de información y el set mínimo de metadatos a intercambiar por tipo documental acordado, determinar el formato y esquema común estandarizado a utilizar y la sintaxis a nivel de campo de metadatos a intercambiar, también elaborar estándares y vocabulario común y compartido para evitar inexactitudes en la interpretación e intercambio de la metadata e información. 2. Cosecha y validación de metadata: durante los dos meses siguientes, realizar cosecha inicial de metadata con datos reales asegurando la compatibilidad entre la información cargada y leída en el repositorio de la ANID; incluye incorporar los acuerdos de interconectividad, sintaxis y semántica de la etapa anterior. Luego realizar una validación del paquete extendido de datos con metadatos cualificados, elaborando diccionarios de datos para ambas instituciones. Finalmente una validación de carga de una nueva cosecha con los metadatos cualificados y reforzar los acuerdos técnicos, de contenido y de búsqueda. 3. Cosecha objeto digital y normalización de metadata: durante los siguientes dos meses, realizar cosechas de objetos digitales y validar que la metadata corresponda al contenido de los objetos digitales. 4. Evaluación del piloto: durante el último mes, evaluar y registrar la experiencia completa incluyendo aspectos técnicos y organizacionales, recursos, costos y recomendaciones técnicas y estándares mínimos a cumplir para replicar y transferir la experiencia como insumo para el piloto avanzado. Por falta de horas de trabajo, se ha avanzado sin documentar en los pasos 1 y 2. La expertise necesaria se relaciona en general con experiencia en bases de datos, DSpace y esquemas de metadata. Los recursos requeridos son contar con dos computadores que permitan procesar (depurar, normalizar y actualizar) y analizar grandes cantidades de datos de forma rápida y precisa que luego se cargan en el repositorio ANID. Se espera que los registros del repositorio aumenten exponencialmente por la integración e interoperabilidad con repositorios universitarios que formarán parte del nodo nacional. Además la contratación de 100 horas de trabajo un ingeniero informático que elabore toda la documentación técnica y la evaluación y registro de toda la experiencia, durante los seis meses de duración del proyecto.
Openness: El repositorio de la ANID es una infraestructura digital no comercial, sin fines de lucro y de acceso abierto usado principalmente (pero no limitado a) por la comunidad científica y académica, utiliza DSpace 7.5 como tecnología de código abierto e identificadores persistentes, sigue el protocolo OAI-PMH (Open Archive Initiative-Protocol for Metadata Harvesting), es el nodo nacional chileno que cosecha LA Referencia y a través de la cual se conecta con OpenAIRE por lo que sigue estándares internacionales de interoperabilidad, utiliza esquema de metadatos Dublin Core, licencias creative commons y una licencia propia de distribución de no exclusividad, cumple con la ley núm. 19.628 sobre protección de la vida privada promoviendo la anonimización de datos cuando es necesario y pertenece al ecosistema de información científica en Chile. El repositorio universitario con el que el proyecto propone interoperar y con los que a futuro formarán parte del nodo nacional también son de acceso abierto, no comercial y sin fines de lucro. Según encuesta aplicada por la CABID http://cabid.cl/ en 2022 el 82% de los repositorios universitarios usan DSpace con estándares de interoperabilidad OAI-PMH, REST, API y OAI ORE, el 50% cuenta con alguna integración tecnológica (ORCID, WoS y/o Scopus, OJS y OMP) y todos usan algún esquema de Dublin Core.
Challenges: 1. Heterogeneidad sintáctica y semántica. Las diferentes representaciones de metadatos y la normalización necesaria para la recuperación de información siempre es un desafío para la interoperabilidad que se puede enfrentar adoptando los estándares mínimos de LA Referencia y un conjunto mínimo de metadatos a cosechar. 2. Directrices a adoptar. Se espera adoptar las directrices de LA Referencia lo que podría implicar un gran esfuerzo por parte de los repositorios universitarios. Un ejercicio realizado por profesionales que participan del diseño del nodo nacional donde aplicaron el validador de LA Referencia a los repositorios universitarios arrojó como resultado que ninguno puede ser cosechado en las condiciones actuales. Este desafío se puede enfrentar adoptando los estándares mínimos de LA Referencia. 3. Actualización de metadatos al actualizar versión DSpace. Generar y aplicar nuevos procedimientos para identificar, actualizar y cosechar metadatos que no cumplen con estándares (legacy) OpenAIRE4; podría implicar grandes esfuerzos sintácticos y semánticos, desafío a enfrentar realizando pruebas con conjunto mínimo de metadatos y extendiendo progresivamente el trabajo. 4. Adopción vocabulario COAR. Según indicaciones de LA Referencia, la transformación de los repositorios debe apuntar al uso de vocabulario COAR. Esto podría implicar un gran esfuerzo para los repositorios, desafío a enfrentar comenzando con conjunto mínimo de metadatos y extendiendo progresivamente el trabajo.
Neglectedness: La compra de bienes y servicios para la ANID como servicio estatal se realiza a través de plataforma de convenio marco del sistema de compras públicas donde las opciones de compra son estandarizadas y no se ajustan a las especificidades que este proyecto requiere como lo son la compra de equipos computacionales de alto rendimiento y la contratación de servicios especializados. Actualmente los equipos que utilizan los profesionales encargados del repositorio son antiguos y lentos para la cantidad de datos a procesar y analizar. La alternativa es a través de financiamiento externo. No se ha aplicado a otro financiamiento ya que no se ha encontrado alguno pertinente.
Success: Corto y mediano plazo: 1. Protocolo de integración e interoperabilidad validado y documentado que pueda ser replicado y transferible, utilizado como medio de verificación del éxito del proyecto. Mediano y largo plazo: 2. Grado de avance del piloto avanzado, calculado como porcentaje de los repositorios universitarios que han replicado el protocolo elaborado en este proyecto, integrado e interoperado metadata y datos con el repositorio ANID. Se espera en el mediano plazo el grado de avance del piloto avanzado sea del 30% y en el largo plazo sea del 90%.
Total Budget: US$ 10864,82
Budget File: pdf
Affiliations: Agencia Nacional de Investigación y Desarrollo – ANID – de Chile
LMIE Carveout: El proyecto no pertenece a esta categoría.
Team Skills: Los tres profesionales encargados del repositorio ANID que participarán del proyecto tienen más de 20 años de experiencia profesional y conocimientos en computación, informática, bibliotecología, bases de datos y distintos sistemas operativos como Linux y Windows. Dos de ellos son ingenieros en computación e informática y uno es bibliotecólogo con mención en análisis de sistema. En conjunto tienen vasta experiencia y trayectoria en el uso y gestión de plataformas de servicios (en particular de repositorios institucionales y sistemas de seguimiento y monitoreo de producción científica), en bases de datos, ingeniería de software, varias versiones de DSpace, modelamiento de datos, desarrollo de herramientas de Business Intelligence, data analytics, data science, integración e interoperabilidad de plataformas como el repositorio de la ANID con LA Referencia. Tienen un alto nivel de compromiso, orientación al logro de objetivos y al impacto que causa en las personas las tareas que realizan, capacidad de planificación y organización del trabajo en equipo, autogestión y aprendizaje autónomo. Con todo esto, están preparados para llevar a cabo este proyecto de interoperabilidad. El profesional a contratar es un ingeniero informático cuyas capacidades, conocimientos y experiencia complementarán a los profesionales de la ANID mientras que los profesionales contrapartes de los repositorios universitarios tienen capacidades, conocimientos y experiencia similares al equipo de la ANID.
How Did You Hear About This Call: Word of mouth (e.g. conversations and emails from IOI staff, friends, colleagues, etc.) / Boca a boca (por ejemplo, conversaciones y correos electrónicos del personal del IOI, amigos, colegas, etc.)
Submission Number: 63
Loading