Mejorando la calidad de los metadatos

Por El referencista - mayo 27, 2024


En la gestión de los repositorios institucionales es muy importante cuidar la consistencia de los metadatos. Quitemos por un momento otros temas como el contenido, la interoperabilidad, la preservación y las políticas, y concentrémonos únicamente en los metadatos.

La consistencia de los metadatos es importante, en principio, por dos razones: primero, porque hace más eficaz la recuperación de información; y, segundo, porque facilita el análisis de datos.

La recuperación de información requiere que utilicemos los metadatos adecuados de acuerdo con ciertos estándares, por ejemplo, el esquema de metadatos Dublin Core; y que además apliquemos criterios para normalizar la información utilizando vocabularios controlados, encabezamientos de materia, tesauros, control de autoridades entre otras herramientas que los bibliotecarios conocen mejor que nadie. De este modo, se hace más eficaz la recuperación de información, ya sea por una búsqueda simple aplicando operadores booleanos, por colecciones o listas.

Asimismo, la información ordenada facilita el análisis de datos masivos al momento de su procesamiento a través de hojas de cálculo o usando herramientas para el análisis de datos.

Dicho lo anterior, estos son tres consejos para mejorar la calidad de los metadatos en nuestros repositorios, especialmente si se usa un software como DSpace, aunque aplica también para otras plataformas.

1. Cree formularios con listas desplegables. La mejor forma de evitar errores al teclear es estableciendo opciones a través de listas desplegables cuando tengamos opciones limitadas; por ejemplo, se puede crear un desplegable para elegir el tipo de acceso que abarca solo existen cuatro opciones: abierto, restringido, embargado o cerrado. Para incorporar formularios desplegables, en el caso de DSpace, deberá editar los archivos de configuración input.forms.xml e item-submission.xml si usa hasta una versión 6.3, pero para el caso de DSpace 7 deberá hacerlo en el archivo submission-forms.xml (que reemplaza a input.forms.xml) y en item.submission.xml que fue actualizado.

2. Incorporar campos con valores por defecto. Esto se puede realizar con el interfaz de administrador sin necesidad de entrar a los archivos en el servidor. Para este caso, lo que se necesita es ubicarse en la edición de plantilla de cada colección, ahí podemos completar valores por defecto. Por ejemplo, si para una determinada colección sabemos que el valor del metadato dc.publisher será siempre el nombre de la misma institución,  podemos registrarlo como predeterminado.

3Limpiar metadatos. Esto corresponde a una fase posterior a la publicación. DSpace nos permite realizar exportaciones masivas de nuestras colecciones en un archivo con extensión CSV (valores separados por comas), el cual podemos limpiar para reimportar de veinte en veinte a nuestro repositorio, aunque con una configuración en el servidor se puede habilitar para subir hasta mil registros de un solo tirón. Si trabajamos con una cantidad alta de registros, lo más conveniente es usar OpenRefine, que es fácil de instalar y muy amigable para limpiar datos.

 

César Chumbiauca Sánchez

Imagen destacata: imagen generada con wordart.com


 

  • Compartir:

También te puede interesar

0 Comentarios