Autodocumentación: el blog

jueves, 19 de febrero de 2026

Una guía de preservación digital (en abierto) para entender los riesgos de la documentación digital

Esta entrada es un extracto de la publicada en el blog Metadatos vs. datos.

La información, tu información, debe ser comprensible y accesible en el tiempo pero... ¿haces algo para asegurarte de que lo sea? Si no es así, debes saber que existen varios riesgos o amenazas que ponen en peligro su existencia, que puedes abrir esa fotografía que hiciste a tu madre hace 15 años y que guardaste en un disco duro externo para no perderla. ¿Crees que está en las mejores condiciones? ¡La vida útil de un disco duro es de unos 5 años!

Por suerte, existe la preservación digital que, aunque no puede afirmar al 100% que un documento electrónico actual sea legible en 25 años, busca formas de conseguirlo, o al menos lo intenta. Hay distintas guías y manuales que tratan, con mayor o menor profundidad, muchos de los elementos que giran en torno a la preservación digital.

Pues bien, hace unos meses publiqué una guía actualizada y en abierto, con la que cualquier persona interesada puede tener un primer acercamiento a esto de la preservación digital, sin conocimientos previos. Incluye seis capítulos, que inciden en la complejidad de mantener la autenticidad, integridad y accesibilidad de los materiales digitales frente a los constantes cambios tecnológicos, la actividad humana o fenómenos adversos:

Patrimonio y Contexto.
Fundamentos y normas.
Formatos de preservación.
Riesgos y estrategias de preservación digital.
Metadatos.
Planificación y modelos.

Para ampliar información, consulta la entrada publicada en Metadatos vs. Datos o bien accede a la guía de preservación digital.

Referencia: Baños Moreno, M. J. (2025). Preservación digital: una visión desde la Gestión de la Información. Editum. Ediciones de la Universidad de Murcia. https://doi.org/10.6018/editum.3176

domingo, 1 de febrero de 2026

Handy Library vive, la lucha sigue

Hace ¡CASI SEIS AÑOS! publiqué esta entrada: Handy Library: una opción de app sencilla y rápida para catalogar libros en bibliotecas personales y todavía sigo usándola como mi herramienta cabecera para gestionar mi colección de libros en papel.

En plena pandemia, dediqué unas cuantas horas a catalogar y ordenar los 900 libros que teníamos en ese momento, repartidos en 7 estanterías.

Hoy sigo (seguimos) usándola para catalogar nuevas adquisiciones, eliminar los libros que regalamos, etiquetar los libros ya leídos o los prestados (si te he dejado un libro y estás leyendo esto: sé que lo tienes). Otro de los usos frecuentes es comprobar, estando en una librería, si ya tengo en casa el libro que tengo en la mano.

También he ido corrigiendo mis propios errores al catalogar, sobre todo con categorías mal escritas o portadas erróneas. Hay otros que no puedo corregir sin dedicarle un tiempo que ahora no tengo.

En este tiempo, he comprado la aplicación y me he convertido en beta tester, aportando algunas sugerencias de mejora que tienen que ver con traducciones al español, la búsqueda de portadas y de ISBN. Una mejora sustancial sería el permitir una gestión multidispositivos, de forma que pudiéramos compartir varias personas estos datos (el proveedor tiene otra herramienta que sí que lo hace).

Entre sus últimas actualizaciones incluye algunas estadísticas, como las de los géneros más comunes (no lo busquéis, el género Simón no existe, salvo en mi biblioteca :P).

Sigo recomendándola como herramienta sencilla e intuitiva para lo que es, para la gestión de una biblioteca pequeña, personal desde el móvil.

lunes, 1 de diciembre de 2025

Las vías de publicación en acceso abierto en ciencia

Al pensar en qué revista publicar un trabajo científico debemos tener en cuenta su vía de publicación en acceso abierto. La Declaración de Budapest (2002) establecía 2 vías:

Vía verde: de auto-archivo, se basa en depositar los trabajos en un repositorio.
Vía dorada: la revista cuenta con revisión por pares, publica los trabajos en acceso abierto de manera inmediata y perpetua en el tiempo. Quien ostenta la autoría mantiene el copyright. La revista puede requerir APCs (Article Processing Charges), pero no cobra por el acceso.

Estas dos vías son complementarias, como explica (Biblioteca de la UCM), ya que la publicación en acceso abierto en una revista a veces no es suficiente para cumplir con los requerimientos de las entidades financiadoras de proyectos de investigación. Así ocurre, por ejemplo, con el Programa Marco Horizonte Europa (2021-2027). En muchas convocatorias de financiación, obligan a depositar el artículo en un repositorio. Este depósito es compatible con su publicación en abierto en una revista, siempre que se respeten las condiciones de la editorial (embargo, tipo de versión...)

Con el tiempo, aparecieron otras tres vías más:

Vía diamante o platino: las revistas publican en acceso abierto, sin cobrar por publicar ni por acceder a sus publicaciones. Suele tratarse de revistas sostenidas por instituciones académicas o gubernamentales. Es el caso, por ejemplo, de la revista Anales de Documentación.
Vía híbrida: se pueden pagar (o no) los gastos de procesamiento de artículos (APCs) a cambio de que el artículo esté en acceso abierto. En caso contrario, el funcionamiento normal de la revista suele ser el pago por suscripción. Esta opción es conocida como open choice (Biblioteca de la UCM). Un ejemplo lo encontramos en la revista El Profesional de la Información.
Vía bronce: aplica en artículos que son de libre lectura en las páginas de las editoriales, pero sin una licencia abierta explícita que permita su distribución y reutilización (Biblioteca de la UCM). Habitualmente, es a editorial quien asume los costes de procesamiento, pero autor/a no conserva el copyright.

En la siguiente tabla, de elaboración propia a partir de los datos anteriores, se muestran las características de estas cinco vías de publicación en acceso abierto.

Características de las distintas vías de publicación en acceso abierto

Explicación de los iconos usados en la tabla anterior

¿Y cómo sabemos cuál es la vía de una revista o si podemos subir un trabajo publicado a un repositorio?

Existen tres formas de conseguir esta información:

Lógicamente, acceder a la información publicada por la propia revista.
DULCINEA: proyecto para conocer las políticas editoriales de las revistas españolas respecto al acceso a sus archivos, los derechos de explotación y licencias de publicación, y cómo estos pueden afectar a su posterior auto-archivo en repositorios institucionales o temáticos. Se clasifican las revistas en tres colores, dependiendo del nivel de acceso: blanco, verde o azul.
Open Policy Finder (anteriormente llamado SHERPA/ROMEO): es forma similar al anterior, pero de ámbito internacional.

martes, 4 de noviembre de 2025

¿Estamos usando PDF/A correctamente?

Distintas versiones de PDF/A, distintos resultados

En iPRESS 2025, Peter Wyatt defendía la necesidad de abandonar PDF/A-1 como formato de preservación, por obsoleto. Específicamente, según recoge Potter, Wyatt indicaba que esta versión prohíbe la transparencia, las sombras paralelas y el JPEG2000 y su uso simplifica el contenido y distorsiona su autenticidad.

Este autor reivindicaba la necesidad de utilizar PDF/A-4 (ISO 19005-4:2020), basado en PDF 2.0, que integra accesibilidad, archivos incrustados y modelos de metadatos más completos.

En otras palabras, aboga por utilizar esta última versión, básicamente por ser la más preparada para la gestión de la preservación digital en las organizaciones. Así, entre otras cuestiones, elimina la necesidad de embeber esquemas de metadatos en los propios ficheros PDF/A y pasa a recomendarlo, aunque no necesariamente de forma embebida, la gestión de los metadatos y de sus esquemas puede ser externa o agruparlos en portfolios.

Claro, que una cosa son los esquemas de metadatos, y otra los metadatos en sí, ¿cómo pueden aparecer?

Tres formas de gestionar los metadatos asociados con ficheros

En general, como se recoge en Preservación digital: una visión desde la Gestión de la Información, podemos encontrarlos de tres maneras distintas:

Incrustados en el propio recurso al que se refieren. Por ejemplo, en formatos de fichero que soporten encabezamientos descriptivos o encapsulado de ficheros. El uso de formatos de encapsulado estandarizados es tendencia en la preservación digital del material audiovisual, debido a su capacidad para manejar las relaciones entre los ficheros. Estos formatos de encapsulado también permiten mantener toda la información primaria de un fichero dentro del objeto digital (Bradley et al., 2020, p. 25).
Separados del recurso y almacenados en una base de datos, repositorio, etc., habitualmente con un identificador único que asegura que esos metadatos se refieren a dicho recurso;
Separados pero vinculados al recurso, por ejemplo, dentro de una estructura de repositorio.

En este sentido, ¿estamos haciendo un uso correcto de PDF/A? Para Wyatt y Potter, la respuesta es clara, si seguimos generando documentos con la versión de formato PDF/A-1, NO. ¿Qué estamos haciendo en nuestras instituciones de la memoria?

Fuentes

Baños Moreno, M. J. (2025). Preservación digital: Una visión desde la Gestión de la Información (Vol. 8). Editum. Ediciones de la Universidad de Murcia. https://doi.org/10.6018/editum.3176
iPRES 2025 | 21st International Conference on Digital Preservation. (s. f.). iPRES2025. Recuperado 4 de noviembre de 2025, de https://www.ipres2025.nz
Potter, A. (2025, noviembre 3). Inside the Black Box of PDF/A [Substack newsletter]. Andrew Potter. https://metaarchivist.substack.com/p/inside-the-black-box-of-pdfa

sábado, 15 de febrero de 2025

Curso Experta Profesional UNED Tecnologías Avanzadas para la Gestión y Documentación del Patrimonio Cultural

Recientemente he terminado el curso de experta profesional de la UNED Tecnologías Avanzadas para la Gestión y Documentación del Patrimonio Cultural.

Dividido en varios módulos (de los cuales es necesario superar 3 obligatoriamente para optar a certificación), permite adquirir conocimiento de nuevas tecnologías y softwares más innovadores para la Gestión y Documentación del Patrimonio Cultural.

En concreto, entre septiembre de 2024 y febrero de 2025, con un total de 375 horas, he cursado los módulos:

El Patrimonio Cultural en la era digital (común a las dos especialidades disponibles): se trata de una introducción al Patrimonio Cultural, acercándonos a los conceptos más básicos relacionados con esta cuestión. En este módulo, evaluado a partir de cuestionarios, se consigue una visión general del curso.
Herramientas digitales para la gestión del patrimonio: los contenidos giran en torno a la gestión de los bienes culturales, así como su estudio en materia de conservación y difusión. El sistema de evaluación consiste en cuestionarios y prácticas, que merece la pena destacar por lo aprendido: búsqueda en Europeana: se incide en el uso y características de este agregador de contenidos; uso de Omeka Classic: se trabaja el uso y gestión de este software; uso de Transkribus, herramienta de transcripción automatizada
Herramientas digitales para la gestión patrimonial del territorio y paisaje: se centra en conocimientos teóricos sobre referencias geográficas, características del territorio, geolocalización y, sobre todo, en el uso de Sistemas de Información Geográfica (SIG) para la valoración, promoción y gestión del Patrimonio Cultural y del paisaje. El sistema de evaluación es de prácticas con el software libre QGIS.

Mapa de Alguazas con recorrido a pie, hecho con QGIS

Este curso está orientado a una gama bastante amplia de profesionales, tantos como caben en la variedad de patrimonio cultural, incluyendo las especialidades de Archivística, Biblioteconomía, Documentación y Museos.

Si estás interesado/a en cursarlo, no te lo pienses, merece la pena... además, para determinadas titulaciones es gratuito, ya que está financiado por los fondos Next Generation, de la Unión Europea.

viernes, 8 de julio de 2022

Ideas para la selección de biografías de mujeres para editatonas de Wikipedia

En Murcia se han organizado un par de editatonas de mujeres escritoras, como se comentaba en esta entrada de Wikiesfera.

Si os estáis preguntando por qué se habla de editatonas y no de editatón, el motivo es, una vez más, por una brecha de género entre quienes participan en esta enciclopedia. Así, como se recoge en esta entrada de la propia Wikipedia: es una editatona "cuando únicamente o principalmente participan mujeres". La segunda cuestión es el por qué es necesario "forzar" estas actividades. Y las dos respuestas asociadas son muy sencillas:

Participan pocas mujeres
Pocas mujeres tienen su propia entrada en Wikipedia

Con estas dos premisas, un grupo de muchachas nos preguntábamos cómo podríamos seleccionar una lista de mujeres que llevar a futuras editatonas de Wikipedia. De entrada, se nos ocurren todas estas posibilidades:

Lluvia de ideas, centrada en un tema y área geográfica.
Editoras de Wikipedia expertas en el tema que se analiza, que indiquen un punto de partida.
Otras editatonas, como #GastrónomasBNE de la Biblioteca Nacional de España
Bibliografía especializada, mucha de la cual podemos encontrar en bibliotecas públicas, que están para usarse.
Búsquedas en bases de datos o repositorios de publicaciones científicas, por áreas. Así, por ejemplo, podemos encontrarnos a la filósofa Nieves Soriano Nieto.
Fuentes primarias identificadas:

Listas de profesionales que ejercen en la actualidad: repertorios especializados, who is who, colegios oficiales, profesoras, etc.
Recortes de prensa en que aparezcan, ya sean como objetos o sujetos, tanto en medios en curso como históricos
Efemérides que se recogen en publicaciones como: exposiciones, catálogos, suplementos, etc.
Premios que reconocen la actividad de las referentes
En determinadas circunstancias, fuentes orales y/o personales, como se comenta en esta campaña internacional Arte+Feminismo de Wikimedia Uruguay y la Intendencia de Montevideo.
Nomenclator (nombres de calles). Por ejemplo, Wikimedia ya lo planteó en Montevideo, "teniendo como base el nomenclator de Montevideo que hay muchísimos nombres de calles de mujeres pero no sabemos quiénes son, qué hicieron"
Eventos en que participan, donde esta XIX Semana de la Filosofía de la Region de Murcia. Es fácil identificarlas, porque casi siempre destacan por ser pocas con respecto al número de hombres, salvo que traten específicamente temas "femeninos" o sobre feminismo, como esta XVIII Semana de la Filosofía de la Sociedad de Filosofía de la Región de Murcia, dedicada al problema del feminismo.

¿Alguna más que no hayamos contemplado?

lunes, 29 de noviembre de 2021

Comunicación a congreso en ISKO: "Identificación y validación de formatos se ficheros orientada a la preservación digital de documentos: de TIKA a DROID"

Recientemente, he participado en el V Congresso ISKO Espanha-Portugal (15.º ISKO España), celebrado en Lisboa, 25 e 26 de novembro de 2021.

En esta ocasión, la comunicación que llevé, que viene a recoger parte del trabajo que se realiza en el servicio de preservación digital de Odilo, llevaba por título "Identificación y validación de formatos se ficheros orientada a la preservación digital de documentos: de TIKA a DROID"

Con una rapidez sorprendente por parte de la organización, ya están disponibles las actas del Congreso en el siguiente enlace: http://hdl.handle.net/10451/50067

lunes, 23 de agosto de 2021

Comunicación: Homeopatía: análisis terminológico de la web basado en la recolección de páginas mediante “Crawler by domain”

En octubre presentaré, junto con los coautores, la comunicación a congreso: Homeopatía: análisis terminológico de la web basado en la recolección de páginas mediante “Crawler by domain”. El resumen del trabajo es el siguiente:

La explosión de la información en Internet ha tenido como consecuencia que los usuarios tengan dificultades para discriminar fuentes de información fiables. Esto, unido al auge de algunas pseudociencias, puede implicar un riesgo para los pacientes que abandonan los tratamientos médicos a favor de pseudoterapias como la homeopatía, al confundir fuentes de información sobre salud confiables. Se realiza un análisis acerca del contenido de las páginas web que tratan sobre la homeopatía con el objetivo de determinar qué términos se utilizan para representar los conceptos relacionados. Se elabora un análisis de contenido de páginas web; observando la ausencia de estructuración de los datos, se ha creado un Crawler que recupera páginas con determinados contenidos, asegurando la adecuación de las fuentes al dominio analizado.

Es la primera vez que participo en IBERSID, que me hace especialmente ilusión, aunque el virus lo haya convertido en un evento en línea y siga sin conocer Zaragoza (por ahora).

El programa provisional lo encontraréis en: https://www.ibersid.es/es/programa-2021-provisional/

viernes, 10 de abril de 2020

Handy library: una opción de app sencilla y rápida para catalogar libros en bibliotecas personales

Ejemplo de cómicos catalogados con Handy Library

Cómics catalogados

Varias personas me habéis preguntado qué app utilizado para catalogar los libros de mi biblioteca personal. Pues bien, llevo tiempo utilizando Handy Library para este menester. Os cuento cómo es y cómo funciona.

1. ¿Cómo obtengo Handy Library y cómo empiezo a utilizarlo?

Basta con acceder al Play Store y descargarla. Creo que sólo funciona para Android. Una vez descargado, recomiendo adaptar algunos elementos de la app a lo que necesito. En caso contrario, tendré que volver sobre mis pasos:

Creación de estantes: en la versión gratuita de la aplicación puedo tener hasta 4 estantes. Si tengo claro que los voy a utilizar, es mejor crearlos antes de dar de alta ningún libro. Si no, tendré que cambiar de estantería uno a uno, y eso puede llegar a ser muy tedioso si tienes bastantes.
Materias: por defecto, la app trae (al menos en versiones anteriores) algunas materias (en inglés). Si las quiero cambiar o voy a añadir otras, es mejor hacerlo ahora. ¿Por qué? Porque si asigno una materia X a un libro Y y, pasado un tiempo, modifico esta materia, en el libro no se actualiza, por lo que tendría que hacerlo manualmente.

2. ¿Qué puedo catalogar con Handy Library?

Bueno, lo primero es indicar que lo más frecuente son libros, pero se puede catalogar cualquier tipo de recurso. Así, yo tengo en mi catálogo libros (literatura, ensayo, cómics) revistas e incluso podría incluir algún juego de mesa, ahora que en muchas bibliotecas se han incluido como parte del material de préstamo. Lógicamente, también podríamos recoger aquí películas, videojuegos, etc. Sin embargo, la aplicación está claramente orientada a los libros, por lo que algunos campos no encajarían para estos recursos y, por el contrario, puede que nos falten algunos campos de interés.

3. ¿Qué utilidades tiene Handy Library?

Tiene varias utilidades que la hacen interesante, como son:

Catalogación de libros y otros materiales de tres formas posibles: búsqueda en línea, escaneo de código de barras y manualmente (luego entraré un poco más en esto).
Exportación de mi catálogo, con dos formatos posibles: .xls y .db.
Importación de elementos a mi catálogo (no lo he probado y podría considerarse una cuarta forma de incorporación de recursos a mi biblioteca).
Búsqueda en tu catálogo por varios campos.
Registro de libros prestados.
Indicación de recursos favoritos.
Indicación de libros ya leídos.

4. ¿Cómo catalogo mis recursos en Handy Library?

Como decía en el punto anterior, para incorporar recursos a mi biblioteca tengo 3 formas diferentes (cuatro, si incluyo la importación). Lo normal, para dedicar menos tiempo, es comenzar por "Escanear ISBN).

Libro no detectado por la app

Escanear ISBN: como decía, es la opción más rápida. Rescata los metadatos y una imagen de la cubierta del libro de Goodreads, si la hubiera y, supongo, también de la propia base de datos compartida de Handy Library. Sobre esto no he podido obtener más información (la he extraído del fichero xls de exportación).
Buscar en línea: es bastante habitual que el libro no tenga código de barras. En este caso, siempre se puede buscar en línea tecleando a mano algún metadato del libro. Lo mejor es hacerlo por ISBN, porque es el más unívoco por edición. Si no se recupera nada por ahí (muchas veces ese dato no está guardado), podemos buscar por autor o por título.
Añadir manual: se trata de darlo de alta a mano, metadato a metadato, en el caso de no encontrarlo de ninguna de las dos formas anteriores.

En todos los casos es recomendable revisar los metadatos incorporados porque puede que haya algunos datos diferentes. Esto ocurre porque, al final, los datos han sido incorporados por diferentes personas, que también se pueden equivocar. Además, puede haber algunas variaciones por el simple paso del tiempo. Cuento algunas cosas que me he encontrado:

El ISBN es el de la colección y no el del libro individual.

El problema de hacerlo así es que no puedes identificar unívocamente cada recurso, por lo que siempre es mejor recurrir al ISBN individual.

Inconsistencias o variaciones en los metadatos.

Aquí hay más surtido 😆 pero creo que estos casos son los más frecuentes:

Títulos mal redactados: los errores ortográficos son frecuentes. Además, hay que tener en cuenta factores como artículos o preposiciones al comienzo del título. Por ejemplo: "La cena secreta". En mi caso, yo lo estoy guardando como "Cena secreta, La".
Formas diferentes de hacer referencia a un mismo autor: es recomendable optar por una y utilizar siempre la misma.
Formas diferentes de hacer referencia a una colección: si las colecciones son muy largas en el tiempo, puede que sean renombradas o directamente, que no se especifiquen. Si conocemos la colección, es mejor mantener la misma denominación para facilitar su recuperación.
Formas diferentes de hacer referencia a una editorial: las editoriales cambian de nombre, se asocian, se separan, etc. Creo que es mejor utilizar siempre el mismo identificador para dar consistencia a mi base de datos. Por ejemplo: "Espasa" y "Espasa Calpe" los he guardado como "Espasa".

La cubierta del libro importado no se corresponde con el ejemplar que tengo en la mano.

Si el libro es importado, puede que la edición de tu libro sea diferente. Aunque parezca que el libro es exactamente el mismo, si la edición es distinta, es que hay algo que ha cambiado. ¿Cómo puedes saber si se trata de ediciones distintas? Lo normal es que en las páginas iniciales o finales del libro haya información sobre la edición. En todo caso, el ISBN del libro es diferente. Esto no ocurre, por ejemplo, con las reimpresiones.

5. ¿Cómo exporto mi catálogo? ¿Para qué lo puedo utilizar?

El proceso es muy sencillo, basta con ir a las opciones general de la aplicación y pinchar en "Exportar". Aquí tendremos dos opciones:

Exportar a un archivo Handylibrary.xls.

Descarga el fichero en tu móvil, en formato xls. Este fichero se puede abrir con cualquier programa con Hoja de cálculo que lea xls. Con Excel, por ejemplo, podremos ver los datos de nuestra biblioteca y, además, una referencia al nombre de la imagen de la cubierta del libro. Por esto, es muy importante que también hagamos una copia de seguridad de todas esas imágenes.

Copia de seguridad en la cuenta de Google Drive.

Descarga el fichero en tu Drive con formato .db. Se trata de un fichero de base de datos que, supongo, en caso de borrado de la aplicación podríamos utilizar para restaurar el catálogo.
Además de guardar toda esta información como salvaguarda, el fichero xls nos puede ser muy útil para otra cosa: Corregir errores. Utilizando los filtros de Excel es mucho más fácil arreglar aquellos datos erróneos de los que antes no nos hemos dato cuenta y que mencionaba antes. Las correcciones más útiles que hacer tienen que ver con denominaciones de diferentes de autores, editoriales y series.

Fichero xls exportado de Handy Library y filtro de autor

6. ¿Cómo busco en mi catálogo?

El proceso es bastante intuitivo. Al acceder a la aplicación, en la parte superior, hay una lupa que permite localizar recursos por autor, título o ISBN. Además, tengo la opción de filtrar por autor, materia (categoría), serie, favoritos, leídos (Leer) y pendientes de leer (No leídos). Esta opción aparece representada mediante un triángulo invertido con tres rayitas. <>

7. ¿Qué opciones de visualización tengo?

Existen sólo dos opciones:

como listado, donde puedo ver cubierta, título, autor, número de páginas y fecha de publicación
como cuadrícula (se muestra en la primera imagen del post), donde se muestra la cubierta y el título.

jueves, 10 de enero de 2019

Vídeo de la comunicación "El servicio de preservación digital como garantía de control de los riesgos asociados a la documentación de archivo. El caso de Odilo Preserver"

Momento de la presentación

Hace un par de meses presenté la comunicación "El servicio de preservación digital como garantía de control de los riesgos asociados a la documentación de archivo. El caso de Odilo Preserver" en el VII Seminario Hispano-Brasileño de Investigación en Información, Documentación y Sociedad (7shb).

La televisión de la Universidad de Murcia ya ha subido el vídeo de la presentación: https://tv.um.es/video?id=125541

Aquí el texto: https://scholar.google.es/scholar?oi=bibs&cluster=12346176012862666035&btnI=1&hl=es

lunes, 2 de julio de 2018

Publicado el libro BIBLIOTECAS DIGITAIS - NOVAS TENDÊNCIAS NA NAVEGAÇÃO EM CONTEXTO

Recientemente, tras un largo periodo, se ha publicado el libro BIBLIOTECAS DIGITAIS - NOVAS TENDÊNCIAS NA NAVEGAÇÃO EM CONTEXTO (ISBN: 9788571934238), com Gercina Lima como coordinadora. Éste recoge las contribuciones de varios integrantes del grupo de investigación Modelagem Conceitual para Organização e Representação da Informação Hipertextual MHTX de la Escola de Ciência da Informação de la Universidade Federal de Minas Gerais (UFMG).

El sumario del libro, descargable aquí, en el que participé con capítulo (en castellano), es el siguiente:

Capítulo 1. Aspectos Cognitivos na Categorização: Buscando o Contexto (Gercina Ângela de Lima) Capítulo 2. Análise do Gesto Categorial do Classificador e do Classificacionista na Biblioteconomia e Ciência da Informação (Alessandra Rodrigues da Silva)
Capítulo 3. Usabilidade em Bibliotecas Digitais (Fernanda Pereira)
Capítulo 4. Contribuições da Arquitetura da Informação para Bibliotecas Digitais de Teses e Dissertações (Kelly Cristiane Santos Morais)
Capítulo 5. Reengenharia de Tesauros Tradicionais (Benildes Coura Moreira dos Santos Maculan)
Capítulo 6. Terminologia e Documentação: um Diálogo com Aplicações Possíveis (Soraia de Andrade Lara Carvalho)
Capítulo 7. Evolución de los Instrumentos para la Representación del Conocimiento: de las listas de términos a las ontologías (María-José Baños-Moreno). RESUMEN DEL CAPÍTULO: Es necesario conocer qué herramientas de representación del conocimiento, previas a las ontologías, se han ido desarrollando, especialmente en el área de las Ciencias de la Información.Diversos autores han analizado y comparado estas herramientas, sus objetivos, aquellas características que comparten y otras en las que divergen. Habitualmente, el propósito es aprovechar las potencialidades de unas en el desarrollo de otras (reutilización), o bien justificar el uso de éstas frente a aquellas para una circunstancia concreta (selección por adecuación). En otros casos, el fin es conocer la situación en cuanto a usos y evolución. Este capítulo quiere mostrar la interrelación entre varias herramientas de representación del conocimiento. La presentación pone en evidencia cómo estas herramientas son cada vez más complejas y asumen parte de la estructura y características del vocabulario previamente descrito. Con ello se pretende incidir, principalmente, en el estrecho vínculo entre tesauros, eminentemente documentales, y las ontologías, desarrolladas en los últimos años esencialmente por profesionales de la informática.
Capítulo 8. Tendências da Pesquisa em Organização do Conhecimento: da Biblioteca Tradicional à Biblioteca na Web 3.0 (Gercina Ângela de Lima)

martes, 10 de abril de 2018

Disponible la tesis Propuesta de modelado de una ontología de dominio para la representación de acciones en política-economía en el repositorio de la Universidad de Murcia

Bueno, pues... mi tesis, Propuesta de modelado de una ontología de dominio para la representación de acciones en política-economía, ya está disponible en línea en el repositorio institucional de la Universidad de Murcia: http://hdl.handle.net/10201/56661, por si alguien quiere hacerse mala sangre con ella :P

INTRODUCCIÓN: Buena parte de la información político-económica es difundida por los medios de comunicación social a través de noticias en formato digital. Sin embargo, dichos contenidos, y los de cualquier tipo en general, no tienen una estructura homogénea y se publican en grandes cantidades, lo que dificulta la extracción de conocimiento formalizado. Para resolver estos problemas a lo largo del tiempo se han desarrollado herramientas de organización y representación de la información. En los últimos años, en el marco de la web semántica aparecieron las ontologías, vocabularios que pueden mejorar la representación del contenido de documentos con un bajo nivel de estructuración, incorporando nuevos elementos a las herramientas tradicionalmente utilizadas. Ahora bien, el modelado de ontologías es complejo y requiere, entre otros, del uso de técnicas de procesamiento del lenguaje natural (indización automática) para dotar al vocabulario de elementos para la descripción de contenidos.

OBJETIVOS E HIPÓTESIS: En este sentido, se plantea como objetivo general el modelado de una ontología con la que contribuir a la representación de acciones del dominio político-económico y facilitar la comprensión de los acontecimientos del mundo real en dicho contexto. Se propone la hipótesis de si el empleo de noticias de prensa digital como fuente para la adquisición de conocimiento y la aplicación de técnicas de indización humana y semiautomática para la extracción de términos son adecuados para el modelado de la ontología propuesta.

METODOLOGÍA: Para ello, se sigue una metodología que comprende la configuración de una muestra de noticias del dominio político-económico de diarios generalistas de ámbito internacional; el análisis de la teoría de la Gramática de Casos aplicado al modelado de una ontología general para la descripción de acciones (ONA); la indización humana y semiautomática de una submuestra de noticias para la modificación de ONA y el modelado inicial de la ontología de dominio ONAPE (ONtología de Acciones en Política-Economía); y el mapeado inicial con otros vocabularios, orientado a la identificación de elementos equivalentes y a la definición de clases y propiedades. ONAPE es evaluada a partir de la instanciación de las palabras clave extraídas del código fuente de noticias de una submuestra con un software desarrollado ad hoc, MetadadosHTML y la anotación semántica de un recorte de esta submuestra. Finalmente, se analiza la adecuación de ONAPE (y de ONA) al dominio objeto de estudio, mediante la aplicación de fórmulas de precisión, exhaustividad y medida-F. En todos los casos se obtienen valores superiores a 0.90, lo que asegura la corrección y especificación de los elementos de la ontología modelada.

CONCLUSIONES: La metodología utilizada se ha revelado útil para el propósito definido la metodología empleada. Por tanto, la hipótesis se cumple, es posible modelar una ontología de dominio con base en un componente teórico asentado, la Gramática de Casos y se atiende el objetivo planteado. Sin embargo, para que ONA y ONAPE sigan siendo útiles es necesaria su actualización por medio del análisis de nuevos corpora de noticias. En lo referente a MetadadosHTML, se pone en evidencia la dificultad del intercambio de información entre sistemas, ya que, aunque existen numerosos esquemas de metadatos para la descripción de noticias, ninguno es un estándar claro. Como trabajos futuros se plantean, entre otros: el uso de ONA u ONAPE en proyectos orientados al aprendizaje automático de software para la descripción automática de documentos y la especialización de ONAPE en subdominios concretos.

miércoles, 4 de abril de 2018

Apuntes de encuadernación: cosido seguido

Cosido seguido de segundo cuaderno

Revisando la documentación que almaceno en un disco duro he encontrado algunos de mis apuntes de la Licenciatura de Documentación.

Una de las asignaturas que más me gustaba era CRPD.

Me ha dado mucha nostalgia al recordar estas clases y me ha entrado el ansia por preparar nuevas encuadernaciones. Si te entra la curiosidad sobre cómo realizar un cosido seguido y después encuadernar tu creación, en este documento que preparé a partir de las explicaciones de Amparo, lo explicaba brevemente: CosidoSeguido.pdf.

Espero que sea de utilidad para quien lo use :)

viernes, 9 de febrero de 2018

Alicia, ¿por qué nos odias?

En 2015, Alicia Giménez Bartlett ganaba el Premio Planeta por su obra Hombres desnudos. Por aquella época, en plena enajenación predoctoral y con decenas de libros comprados en espera de un mejor momento (la post-defensa llegaría) pedí el libro en un intercambio de regalos de amigx invisible. Me había llamado la atención el contenido. Quería saber qué tratamiento daba a la prostitución masculina y qué papel jugaban las mujeres y hombres en ésta.

Ya había leído, aunque hacía muchos años, algo de esta autora. En mi pequeña biblioteca tengo Día de perros, el segundo caso de la inspectora Petra Delicado, publicado por Grijalbo y conseguido, según mi propia anotación manuscrita, por el marcapáginas hecho para el 23/04/1999 en mi instituto de entonces, IES Cristóbal Lozano, en Hellín (Albacete). Cerca de Almansa, de donde es oriunda Alicia Giménez. Tenía 15 años.

Con estos antecedentes, hace un par de semanas empecé con Hombres desnudos. Y lo acabé pronto. A quien esté interesada, el libro entretiene y tiene un final inesperado, al menos para mi.

Lo que me llamó la atención es cuando uno de los protagonistas, Javier, un profesor de Lengua desempleado (no diré más sobre sus profesiones para no aguar la lectura a nadie), le pide a un empleo a Irene, una empresaria. Ella le dice que su empresa no puede ofrecerle nada, pero que tiene un contacto que le hará una entrevista para hacer de documentalista. Lo que viene siendo ordenar y guardar. Él, si le explican lo que quieren, por supuesto que puede hacerlo.

Cuando lo terminé, gustándome la novela negra me dije, venga, quizá es el momento de ponerme con Petra Delicado, sólo he leído uno y oye, si tiene tantos es que debe de estar bien. Así que, busco información sobre el primer libro de la saga, Ritos de muerte. Me encuentro con que inicialmente Petra es inspectora de policía, que trabaja en el Servicio de Documentación de una comisaría de Barcelona esperando. Esperando poder cambiar de trabajo y pasar a la acción.

El Departamento de Documentación es una sección insípida. Aquí mandan a intelectuales y mujeres, a gente marginal, en definitiva, que no merece ocupar un puesto de los de verdad en la policía. Y es que, desde que Petra está en documentación, todo está perfectamente fechado y ordenado. Pero claro, Petra se siente frustrada e implora a sus superiores que le den algo auténtico. Bueno, aún ni he leído el libro, pero estas cositas aparecen en las primeras páginas.

Con estas dos referencias parece que el trabajo de documentación, lo puede hacer cualquiera sin formación especializada (aprovecho para añadir la guía docente del Grado de Información y Documentación de este curso en la Universidad de Murcia). Esa persona, además, debe estar ahí porque no le queda más remedio. Pobre.

Pese a esto, voy a leer la saga de Petra Delicado. Entre otras cosas porque se percibe el alegato feminista. Pero lo voy a hacer con disgusto, Alicia.

Alicia, ¿por qué nos odias?

miércoles, 18 de octubre de 2017

Interactivity features of online newspapers: from a facsimile model o a multimedia one

La revista Anales de Documentación publica, en su segundo número de 2017, el artículo siguiente:

Baños-Moreno, M.J., Pastor-Sánchez, J.A. & Martínez-Bejar, R. (2017). Interactivity features of online newspapers: from a facsimile model o a multimedia one. Anales de Documentación, 20(2). Retrieved from http://dx.doi.org/10.6018/analesdoc.20.2.282401 (en inglés)

ABSTRACT

The purpose of this article is to know the current interactivity options in online newspapers. To do this, we analyze the concept of (structural) interactivity and establish a measuring tool based on some previous methodologies. This model includes a classification of newspapers into stages of development. In this way, we provide a tool, which allows media firms to know the degree of interactivity in newspapers, assessing what dimensions and parameters are being incorporated. It was applied to a sample of 21 online newspapers. Results show poor implementation of participation and customization options. There is a niche to be covered by sections of user-generated content and closer collaboration journalists-citizens. It will require a real adaptation to the new possibilities of interaction with readers at different levels of involvement and participation. The majority of newspapers are classified in a digital stage and some of them are close to the multimedia phase.

RESUMEN

El objetivo de este artículo es conocer las opciones de interactividad de periódicos en línea. Para esto, se analiza el concepto de interactividad (estructural), identificando sus componentes y definiendo un modelo de evaluación, basada en diversas metodologías que analizan la interactividad en periódicos digitales. Este modelo incluye una clasificación de periódicos en etapas de desarrollo. La herramienta permite conocer el nivel de interactividad de los periódicos y compararlos con otros, indicando qué dimensiones y parámetros están siendo incorporados y cuáles no. El modelo fue aplicado sobre 21 diarios internacionales. Los resultados revelan una escasa implementación de las opciones de participación y personalización. Existe un gran nicho en cuanto al contenido generado por los usuarios y la colaboración periodistas-ciudadanos. La mayoría de los diarios se encuentran en una fase digital. Esto requerirá una verdadera adaptación para las nuevas oportunidades de interacción con los lectores, en distintos niveles de desarrollo.

viernes, 17 de marzo de 2017

Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADATOSHTML

La revista sueca Information Research publica, en su primer número de 2017, el artículo siguiente:

Baños-Moreno, M.J., Felipe, E.R., Pastor-Sánchez, J.A., Lima, G. & Martínez-Bejar, R. (2017). Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADADOSHTML. Information Research, 22(1), paper 740. Retrieved from http://InformationR.net/ir/22-1/paper740.html

RESUMEN:

Los objetivos de este trabajo son determinar qué esquemas se utilizan para título, resumen, palabras clave, autoría y periódico en prensa; conocer qué pautas siguen los periódicos en la implementación de dichos esquemas; y averiguar cómo esto afecta a la extracción de información.

Metodología. Para ello, se define una muestra de diarios y se analiza su código fuente, identificando esquemas utilizados y patrones de uso. Esto permite extraer valores de dato utilizando la aplicación MetadadosHTML.

Resultados. Se han detectado esquemas estándar, ad hoc y propios de los periódicos. Se han hallado diversas prácticas, como valores agrupados en una misma línea de código o por separado; ruido en un valor y errores al referir los nombres de los atributos de esquemas estándar. Estos problemas afectan a la extracción de datos basada en esquemas de metadatos y metadatos en MetadadosHTML.

Conclusiones. Es necesario avanzar en el uso de esquemas estándar, como Dublin Core o schema.org, favoreciendo la implantación de estos (u otros) en los códigos fuente de noticias. También resulta imprescindible la adopción de buenas prácticas al explicitar datos y valores de datos. Sólo así es posible evolucionar en la interoperabilidad entre sistemas y en la recuperación y reutilización de información.

martes, 10 de enero de 2017

Blog de la Biblioteca Regional de Murcia: Si eres de la BRMU, que se entere el mundo

Blog de la Biblioteca Regional de Murcia: Si eres de la BRMU, que se entere el mundo: Nos han tomado la delantera, pero en esto no nos importa que nos adelanten, se trata de una carrera de fondo y quere...

viernes, 9 de diciembre de 2016

Presentación: Fuentes para la búsqueda de ofertas de empleo en el sector privado para profesionales de la información en España. Una experiencia personal

Hace unas semanas presenté la comunicación Fuentes para la búsqueda de ofertas de empleo en el sector privado para profesionales de la información en España. Una experiencia personal en el V Seminario Hispano-Brasileño de Investigación en Información, Documentación y Sociedad, que tuvo lugar entre el14 y el17 de noviembre de 2016 en la Facultad Ciencias de la Documentación, Universidad Complutense.

A la espera de que se publiquen las actas con las comunicaciones del Congreso, he subido a ResearchGate la presentación de esta comunicación.

RESUMEN DE LA COMUNICACIÓN:

El objetivo de este trabajo es ofrecer un marco general de fuentes de información sobre ofertas de empleo para el profesional de la gestión de información, esto es, una guía básica para la búsqueda de empleo activa y eficiente, mostrando como producto final la descripción y clasificación de estos recursos y una serie de recomendaciones para su uso.

Para ello, se han analizado algunas publicaciones especializadas para conocer qué denominaciones existen para el/la profesional de la información. Después se analizan y describen una serie de recursos en línea para la búsqueda de ofertas de trabajo en el sector de la información y documentación, indicándose por qué fuentes comenzar para tener acceso a una buena parte de estas ofertas. También se incluyen recursos habitualmente conocidos por los/as profesionales, a los que se acaba llegando cuando la persona entra en el mundo formativo y/o laboral. Posteriormente, estos recursos son clasificados, utilizando diversos criterios que facilitan su mejor conocimiento. Mediante la observación de los recursos y de las ofertas publicadas, y de la postulación a éstas, se muestran algunas impresiones sobre el funcionamiento y características de los recursos analizados.

Finalmente, a partir de la experimentación con los recursos, utilizando algunas de las denominaciones para el/la profesional de la información indicadas, se recoge una serie de recomendaciones de uso de los recursos, que dan preferencia a ciertos recursos y a las notificaciones y alertas por correo. De esta forma, se evita la duplicidad de tareas y la pérdida de tiempo en tareas que pueden ser automatizadas, ganando en eficiencia.

MÁS INFORMACIÓN:

viernes, 2 de diciembre de 2016

Plataformas bibliotecarias de préstamo y lectura de libros en la Región de Murcia

Para quien no lo sepa, existen dos formas de leer libros en las bibliotecas públicas de la Comunidad Autónoma de la Región de Murcia, como en otras. Por un lado, la tradicional que todas (las personas) sabemos: ir a la biblioteca y tomar prestado (o leer allí mismo) cualquier ejemplar de libro disponible. Por otro, las dos plataformas de préstamo de libros electrónicos a nuestro alcance: eBiblio y odilotk. Ambas están disponibles con el mismo carné de lector(a) de la Biblioteca Regional y la diferencia radica, además de en la oferta de libros disponibles, en quién está detrás del proyecto.

eBIBLIO, LA PLATAFORMA NACIONAL

En el primer caso, eBiblio está auspiciada por el Ministerio de Educación, Cultura y Deporte, que facilita el uso de esta plataforma por todas las Comunidades Autónomas, a excepción del País Vasco). El acceso a eBiblio puede efectuarse tanto desde la página web enlazada como desde su aplicación (app), tanto para dispositivos Android como iOS.

Portada de murcia.ebiblio.es (fecha de captura: 1/12/16)

ODILOTK

En el segundo, la odilotk de la Región, también funciona para lectores de la Red de Bibliotecas de la Región de Murcia y es un servicio prestado a nivel de la propia Comunidad Autónoma. La estructura es similar a la anterior, adoptando las particularidades de color y logotipos propios de la Biblioteca Regional de Murcia.

Actualmente, eBiblio pone a nuestra disposición más de 1670 obras y odilotk (Región de Murcia) cuenta con más de 700 títulos disponibles. En cuanto a los formatos de los libros electrónicos, en ambos casos, los formatos disponibles son ePub y PDF (eBiblio cuenta con 50 audiolibros) y se pueden descargar para leer sin tener nuestros dispositivos conectados a Internet. Otra forma de lectura es, precisamente, a través Internet, visualizando el recurso en nuestro navegador. Posteriormente, el libro se puede devolver desde la propia web de cualquiera de las plataformas, o desde el programa Adobe Digital Editions (ADE), que es el más utilizado para la lectura off-line de libros con DRM (Digital Rights Management).

MÁS INFORMACIÓN

Para más información sobre cómo utilizar estas plataformas, se ha publicado diversa información en Internet, ya que todos los eBiblios y odilotks de las diferentes Comunidades Autónomas y/o ciudades funcionan de forma similar. Se indican a continuación dos fuentes básicas, a nivel de la Región:

Presentación de eBiblio en la web de la Biblioteca Regional, que incluye Manual para el usuario/a, carteles, marcapáginas y diversos enlaces que remiten a más información
Ayuda de la odilotk de la Región de Murcia que, además de textos, cuenta con vídeos explicativos del funcionamiento de la plataforma.

BONUS

Una última cuestión: para quienes gustan de las ediciones cuidadas y bonitas de la editorial Impedimenta, aunque no sea lo mismo que un libro impreso, odilotk dispone de 50 libros de dicha editorial ;)

lunes, 24 de octubre de 2016

Introducción a #Javascript: aplicaciones básicas realizadas en curso Desarrollo de Aplicaciones con Tecnologías Web

Imagen de la calculadora simple
en Javascript

He empezado el curso de certificación profesional Desarrollo de Aplicaciones con Tecnologías Web. Para quienes no conozcan estos certificados, se puede resumir en MUCHOS CONOCIMIENTOS EN POCO ESPACIO DE TIEMPO. Y así, es como, en 90 horas, me he introducido en el fascinante mundo de Javascript.

Javascript es un lenguaje de programación orientado a la creación de páginas web dinámicas (y de pesadillas, dicho sea de paso). En este tiempo, hemos aprendido más bien poquito, y se puede resumir en pocas líneas: cláusulas if, bucles (for, while, do... while), llamada a funciones, Document Object Model (DOM), etc. La mayoría de lo estudiado, está en el libro de Introducción al Javascript.

En este post, en realidad lo único que pretendo es conservar algunas de las cosicas que hemos hecho. Son fáciles para quienes ya tengan conocimientos de programación, a mi me han costado lo mío. Supongo que, en realidad, sirven para poquito. Pero oye, me hace ilusión, que me ha costado lo mío. Puede que hasta sirva para quien empiece :D

Cálculo de la edad de una persona. Este código, a partir de la fecha de nacimiento de una persona, indica los años que ésta tiene, teniendo en cuenta día, mes y año de nacimiento
Calculadora para operaciones simples. Esta calculadora es capaz de sumar, restar, multiplicar y dividir dos números (y sólo dos). También se pone a cero y muestra los números en pantalla. Usa eventos onclick para ello
Comprobador de letra de DNI. Este código facilita la introducción de número y letra del DNI indicando si la letra introducida es la correcta en relación al número especificado
Ecuaciones de segundo grado. Introduciendo a, b y c, en una ecuación de segundo grado, devuelve los dos valores que toma x
Teclado qwerty. Este teclado, que funciona con eventos onclick, es decir, pulsando las teclas correspondientes, permite escribir texto en una caja de texto, incluyendo letras (también la letra ñ), números, comas, puntos, saltos de línea y espacios. También es posible suprimir el último elemento añadido a la cadena de texto

Teclado qwerty y caja de texto