Buscar en el blog

Tamaño de letra: 10 12 14 16 18 20

viernes, 17 de marzo de 2017

Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADATOSHTML

La revista sueca Information Research publica, en su primer número de 2017, el artículo siguiente:

Baños-Moreno, M.J., Felipe, E.R., Pastor-Sánchez, J.A., Lima, G. & Martínez-Bejar, R. (2017). Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADADOSHTMLInformation Research, 22(1), paper 740. Retrieved from http://InformationR.net/ir/22-1/paper740.html

RESUMEN:

Los objetivos de este trabajo son determinar qué esquemas se utilizan para título, resumen, palabras clave, autoría y periódico en prensa; conocer qué pautas siguen los periódicos en la implementación de dichos esquemas; y averiguar cómo esto afecta a la extracción de información. 
Metodología. Para ello, se define una muestra de diarios y se analiza su código fuente, identificando esquemas utilizados y patrones de uso. Esto permite extraer valores de dato utilizando la aplicación MetadadosHTML.
Resultados. Se han detectado esquemas estándar, ad hoc y propios de los periódicos. Se han hallado diversas prácticas, como valores agrupados en una misma línea de código o por separado; ruido en un valor y errores al referir los nombres de los atributos de esquemas estándar. Estos problemas afectan a la extracción de datos basada en esquemas de metadatos y metadatos en MetadadosHTML.
Conclusiones. Es necesario avanzar en el uso de esquemas estándar, como Dublin Core o schema.org, favoreciendo la implantación de estos (u otros) en los códigos fuente de noticias. También resulta imprescindible la adopción de buenas prácticas al explicitar datos y valores de datos. Sólo así es posible evolucionar en la interoperabilidad entre sistemas y en la recuperación y reutilización de información.

martes, 10 de enero de 2017

viernes, 9 de diciembre de 2016

Presentación: Fuentes para la búsqueda de ofertas de empleo en el sector privado para profesionales de la información en España. Una experiencia personal

Hace unas semanas presenté la comunicación Fuentes para la búsqueda de ofertas de empleo en el sector privado para profesionales de la información en España. Una experiencia personal en el V Seminario Hispano-Brasileño de Investigación en Información, Documentación y Sociedad, que tuvo lugar entre el14 y el17 de noviembre de 2016 en la Facultad Ciencias de la Documentación, Universidad Complutense.

A la espera de que se publiquen las actas con las comunicaciones del Congreso, he subido a ResearchGate la presentación de esta comunicación.

RESUMEN DE LA COMUNICACIÓN:

El objetivo de este trabajo es ofrecer un marco general de fuentes de información sobre ofertas de empleo para el profesional de la gestión de información, esto es, una guía básica para la búsqueda de empleo activa y eficiente, mostrando como producto final la descripción y clasificación de estos recursos y una serie de recomendaciones para su uso.
Para ello, se han analizado algunas publicaciones especializadas para conocer qué denominaciones existen para el/la profesional de la información. Después se analizan y describen una serie de recursos en línea para la búsqueda de ofertas de trabajo en el sector de la información y documentación, indicándose por qué fuentes comenzar para tener acceso a una buena parte de estas ofertas. También se incluyen recursos habitualmente conocidos por los/as profesionales, a los que se acaba llegando cuando la persona entra en el mundo formativo y/o laboral. Posteriormente, estos recursos son clasificados, utilizando diversos criterios que facilitan su mejor conocimiento. Mediante la observación de los recursos y de las ofertas publicadas, y de la postulación a éstas, se muestran algunas impresiones sobre el funcionamiento y características de los recursos analizados.
Finalmente, a partir de la experimentación con los recursos, utilizando algunas de las denominaciones para el/la profesional de la información indicadas, se recoge una serie de recomendaciones de uso de los recursos, que dan preferencia a ciertos recursos y a las notificaciones y alertas por correo. De esta forma, se evita la duplicidad de tareas y la pérdida de tiempo en tareas que pueden ser automatizadas, ganando en eficiencia.

MÁS INFORMACIÓN: