Entradas

Mostrando entradas de marzo, 2017

Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADATOSHTML

Imagen
La revista sueca Information Research publica, en su primer número de 2017, el artículo siguiente: Baños-Moreno, M.J., Felipe, E.R., Pastor-Sánchez, J.A., Lima, G. & Martínez-Bejar, R. (2017).  Análisis de metadatos de noticias para la extracción de información del código fuente. El software METADADOSHTML .  Information Research, 22 (1), paper 740. Retrieved from http://InformationR.net/ir/22-1/paper740.html RESUMEN : Los objetivos de este trabajo son determinar qué esquemas se utilizan para título, resumen, palabras clave, autoría y periódico en prensa; conocer qué pautas siguen los periódicos en la implementación de dichos esquemas; y averiguar cómo esto afecta a la extracción de información. Metodología . Para ello, se define una muestra de diarios y se analiza su código fuente, identificando esquemas utilizados y patrones de uso. Esto permite extraer valores de dato utilizando la aplicación MetadadosHTML. Resultados . Se han detectado esquemas estándar, ad