En
la gestión de los repositorios institucionales es muy importante cuidar la
consistencia de los metadatos. Quitemos por un momento otros temas como el
contenido, la interoperabilidad, la preservación y las políticas, y
concentrémonos únicamente en los metadatos.
La
consistencia de los metadatos es importante, en principio, por dos razones:
primero, porque hace más eficaz la recuperación de información; y, segundo,
porque facilita el análisis de datos.
La
recuperación de información requiere que utilicemos los metadatos adecuados de
acuerdo con ciertos estándares, por ejemplo, el esquema de metadatos Dublin
Core; y que además apliquemos criterios para normalizar la información
utilizando vocabularios controlados, encabezamientos de materia, tesauros,
control de autoridades entre otras herramientas que los bibliotecarios conocen
mejor que nadie. De este modo, se hace más eficaz la recuperación de información,
ya sea por una búsqueda simple aplicando operadores booleanos, por colecciones
o listas.
Asimismo,
la información ordenada facilita el análisis de datos masivos al momento de su
procesamiento a través de hojas de cálculo o usando herramientas para el análisis
de datos.
Dicho lo anterior, estos son tres consejos para mejorar la calidad de los metadatos en nuestros repositorios, especialmente si se usa un software como DSpace, aunque aplica también para otras plataformas.
1. Cree formularios con listas desplegables. La mejor forma de evitar errores al teclear es estableciendo opciones a través de listas desplegables cuando tengamos opciones limitadas; por ejemplo, se puede crear un desplegable para elegir el tipo de acceso que abarca solo existen cuatro opciones: abierto, restringido, embargado o cerrado. Para incorporar formularios desplegables, en el caso de DSpace, deberá editar los archivos de configuración input.forms.xml e item-submission.xml si usa hasta una versión 6.3, pero para el caso de DSpace 7 deberá hacerlo en el archivo submission-forms.xml (que reemplaza a input.forms.xml) y en item.submission.xml que fue actualizado.
2. Incorporar campos con valores por defecto. Esto se puede realizar con el interfaz de administrador sin necesidad de entrar a los archivos en el servidor. Para este caso, lo que se necesita es ubicarse en la edición de plantilla de cada colección, ahí podemos completar valores por defecto. Por ejemplo, si para una determinada colección sabemos que el valor del metadato dc.publisher será siempre el nombre de la misma institución, podemos registrarlo como predeterminado.
3. Limpiar metadatos. Esto corresponde a una fase posterior a la publicación. DSpace nos permite realizar exportaciones masivas de nuestras colecciones en un archivo con extensión CSV (valores separados por comas), el cual podemos limpiar para reimportar de veinte en veinte a nuestro repositorio, aunque con una configuración en el servidor se puede habilitar para subir hasta mil registros de un solo tirón. Si trabajamos con una cantidad alta de registros, lo más conveniente es usar OpenRefine, que es fácil de instalar y muy amigable para limpiar datos.
César
Chumbiauca Sánchez