Buscar en el blog

Tamaño de letra: 10 12 14 16 18 20

miércoles, 30 de noviembre de 2011

Lo semántico, lo textual y el documentalista

Lo semántico, lo  textual y el documentalista.



Imagen obtenida a través de Wordle
(extrae gráficamente las palabras del
texto con mayor frecuencia)
Lo sé. Muchos creen que la figura del documentalista (y no, no me refiero al que realiza documentales) está de capa caída (gracias Google por contribuir a esa... "sensación").
Como siempre, las clases del curso de Ayudante de Documentaciónde Medios de Comunicación, han dado sus frutos reflexivos (y hasta me ha dado por pensar...): Ante una necesidad informativa, todos (me incluyo) recurrimos al mágico metabuscador, Google, que todo lo sabe y todo lo puede... ¿o no? 

En algunas sesiones del curso, se nos pedía localizar cierta información, utilizando para ello Internet, en genérico. Evidentemente, y salvo para los casos en que nos había facilitado unas cuantas fuentes específicas (Compludoc, Comunicacióninvisible, TESEO, etc.) fuimos directamente a Google (que quede claro que la información que localizábamos en estos tres, no se recuperaba en Google).

No voy a decir que no sirva para nada, eso sería de idiotas. Si buscas, mejor dicho, si sabes buscar, encuentras. El problema es cuando los resultados pertinentes vienen acompañados de ruido (informativo), o peor aún, de silencio (también informativo).


Esto pasa porque:
  • Google, como cualquier otro servicio basado en el lenguaje natural (palabras clave), no es capaz de simplificar la riqueza léxica del español (o de cualquier otro idioma). Para realizar sus búsquedas, analiza el contenido de las webs e indiza por palabras no vacías (que no necesariamente tienen por qué ser palabras clave), independientemente de si existen sinónimos, homónimos, antónimos, etc.
  • Google, es un indizador automático. Esto significa que los problemas anteriores, derivados del lenguaje natural, tampoco se resuelven a posteriori, pues no pasan por un filtro humano que transforme las palabras clave en descriptores.
  • Google no es capaz de captar el sentido del texto. Y todos sabemos que el ser humano puede escribir, por ejemplo de forma irónica, sin nombrar ni una sola vez el tema principal del mensaje. Ese contenido, se le escapará.
  • Muchas "bases de datos" de medios de comunicación escrita, utilizan el propio motor de búsqueda de Google como "archivo" o "hemeroteca" en línea (quiero pensar que internamente, para su propio trabajo,el análisis documental lo realiza un documentalista), lo que suele provocar resultados impertinentes, sin utilidad real para el usuario.
  • Casi (digo casi porque no los hemos visto todos) ningún medio de comunicación de radio o televisión (ni siquiera RTVE) indiza (al menos de cara al público) sus propios contenidos, lo que hace dificílisimo encontrar información sonora o audiovisual concreta.
¿Esto qué significa
  • Pues que, aunque la información esté ahí, en Internet, no podemos llegar a ella, porque no está bien descrita (léase por indizada). Hace poco leí que el 90% de la información accesible en Internet no se utilizaba, ¿por qué? Pues porque lo automático y reduccionista obvia información pertinente, y al final, es como si no existiera.
  • Que el documentalista es imprescindible hoy más que nunca. Si antes hacía falta por la ingente cantidad de información, ¿cómo no va a ser necesario hoy, cuándo ésta se multiplica diariamente? (el Informe de los Contenidos Digitales en España: Industria y hábitos de consumo 2011, elaborado por ONTSI así lo confirma) Y es que, como decía un amigo, Martín Campoy, hoy más que nunca, PONGA UN DOCUMENTALISTA EN SU VIDA.
MÁS INFORMACIÓN:
  • CAPDEVILA, J. Lluis Codina: "Una inmensa cantidad de ciudadanos practica el monocultivo informacional" (entrevista), [en línea, fecha de consulta: 08/12/2.011] 
  • RUBIO LACOBA, M. y BLANCO GARCÍA, J.C. Mejor que un buscador, un encontrador. En Documentación de las Ciencias de la Información. Universidad Complutense de Madrid,2010. pp.273-287, [en línea, fecha de consulta: 30/11/2.011]
  • INFORME DE LA INDUSTRIA DE LOS CONTENIDOS DIGITALES 2011, AMECTIC, 2011 [en línea, fecha de consulta: 30/11/11]
  • INFORME DE LOS CONTENIDOS DIGITALES EN ESPAÑA: INDUSTRIA Y HÁBITOS DE CONSUMO 2011. ONTSI (Observatorio Nacional de las Telecomunicaciones y de la SI), 2011 [en línea, fecha de consulta: 30/11/11]