Ana Santos: «El Big Data español está aquí, en la Biblioteca Nacional»

La institución guarda datos masivos de la cultura digital española desde 2009. Pronto estarán disponibles desde la «habitación fría»

Ana Santos: «El Big Data español está aquí, en la Biblioteca Nacional» matías nieto

jesús garcía calero

Imaginen que dentro de unas décadas un investigador entra en la Biblioteca Nacional de España (BNE) buscando información de 2015 (sobre las dificultades de Rosa Díez o los últimos inéditos de León Felipe). Allí, se sienta frente a un ordenador y se zambulle en el «big data» español, un bloque de información comprimida que guarda todo lo publicado en internet en nuestro país, que ahora mismo roza los 180 terabites (billones de bits) y para entonces sabe Dios cuánto más.

En 2009 la BNE comenzó a encargar a una institución internacional, Archive.org , que guardase todo el dominio de España en internet (el famoso «.es») cada cierto tiempo. Esa información que se mantuvo en San Francisco está desde diciembre instalada en Madrid y tiene todo lo necesario para crecer sin cuento. Ana Santos, directora de la BNE, se muestra satisfecha por el cambio. Los servidores de este océano subterráneo de información no están online, sino a salvo en una habitación fría, como la llaman, por su sistema de refrigeración, en la BNE. Así lo hacen el resto de grandes bibliotecas nacionales europeas.

Se trata de una de las mejoras que ha traído la ley recién aprobada por el Gobierno (Ley 1/2015, de 24 de marzo que la convierte en organismo autónomo y en «centro depositario y de conservación de la producción cultural española en cualquier soporte, incluidos los documentos electrónicos y sitios web »).

«La ley se nota ya -comenta Ana Santos a ABC-. Para mí fue muy importante porque era la primera vez que se hablaba de la BNE en el Congreso, que todos los portavoces políticos, aunque señalaran carencias de la ley, reconocían el valor de esta institución. Es fundamental ese consenso porque un proyecto como éste no puede ser a corto plazo ni sometido a cambios o vaivenes dependiendo del gobierno. La BNE necesitaba un proyecto de futuro y recorrido que permita dar credibilidad a las actuaciones».

La temida edad oscura

Desde que uno de los padres de internet, Vint Cerf, profetizó que pronto habrá un problema con los datos de la red, que quedarán inaccesibles cuando cambien los formatos que hoy usamos para las fotos y los textos, mucho se ha escrito sobre cómo podríamos salvar la hirviente realidad digital de nuestro tiempo. Este «big data» de la Biblioteca Nacional es el primer paso. Cerf auguraba la pérdida masiva de datos salvo que se puedan salvar con ellas las aplicaciones que nos dan acceso a los documentos, algo harto complejo por problemas de propiedad industrial.

¿Por qué estaba guardada toda la web española en San Francisco? «Aquí nos faltaba la infraestructura, los servidores, el software necesario y sobre todo la formación técnica de los responsables del proyecto -responde-. Es muy ambicioso. No sólo hablamos de una inversión económica (gracias a la ayuda de Red.es), sino una apuesta por el conocimiento especializado, que estamos coordinando con la Biblioteca Nacional de Francia (BNF)», que tiene más experiencia puesto que fundó el Consorcio Internacional para la Preservación de Internet, en el que la BNE ingresó en 2010.

¿Qué es «Big data»?

Esa apuesta por la investigación y el conocimiento supone que los datos pueden cruzarse, navegarse y ser sometidos a búsquedas de todo tipo: eso es exactamente el «big data», el uso para detectar tendencias, realizar predicciones estadísticas, personalizar ofertas o proyectar cualquier realidad reflejada en datos aparentemente invisible sin una base suficiente. Hay ciudades que ahorran energía estudiando el consumo su población. Y crece su uso comercial en todo el mundo.

¿Existe un «big data» cultural? «Sí. El “big data” español está aquí -Ana Santos señala el pavimento con un dedo-. La mayor fuente de información de internet la tiene la BNE. Hasta ahora se rastreaba el dominio “.es”, en general o en temas concretos, pero pronto se sumará el depósito legal electrónico. La ley de la BNE otorga a toda esa información un valor de conocimiento sobre la sociedad española, nos aproxima al mundo de la investigación. Los contenidos generarían mejor conocimiento sobre nuestra cultura».

¿Se imagina una explotación no solo cultural sino comercial del «big data» español? «Esta enorme cantidad de información tiene un gran valor estratégico de desarrollo que habrá quien sea capaz de explotar al máximo. Igual que tiene un valor de desarrollo la generación de conocimiento sobre la cultura española, otro tipo de resultados que generen conocimiento y otras estrategias también valdrán. Se puede plantear. El valor de la información incluye eso. Somos los primeros sorprendidos de tener en las manos este potencial».

Todo ha cambiado desde los primeros volcados genéricos de la web española en 2009. Ahora se reparten «semillas» con temas seleccionados por su relevancia para los futuros investigadores, cuestiones que no deben perderse para la historia de España y después los robots de la BNE cosechan. Se han guardado ya los contenidos relativos a la abdicación de Don Juan Carlos, la proclamación de Don Felipe o la muerte de Adolfo Suárez. Pero también se guardaron las webs españolas con contenidos sobre la muerte de Ana María Matute y Gabriel García Márquez. Nada se ha perdido.

Elecciones para el futuro

¿Y para 2015? Ya está guardado todo lo relativo a las elecciones andaluzas y en preparación el reparto de «semillas» para las múltiples citas electorales de este año. Con todos esos datos no sólo se podrán escrutar resultados, sino también opiniones y los pequeños y grandes terremotos mediáticos sobre los previsibles seísmos del mapa electoral hispano.

Preguntamos a Ana Santos si la BNE es ya como un gran hermano al que nada se escapa: «Algo seguro que se escapa, pero si no intentamos salvar la información válida se escapará todo». Y nos explica las previsiones: «Tenemos preparada infraestructura de almacenamiento suficiente, dependiendo de hasta dónde queramos llegar. Pronto nos plantearemos guardar también vídeos digitales, que pesan mucho más. Y debemos coordinarnos con las Comunidades Autónomas, porque no tendría ningún sentido que esto se hiciera 17 veces en nuestro país. La información que ellos recopilarían sería inútil si no se relaciona con el resto».

Además, la cooperación con las bibliotecas europeas completa el trabajo. «Cuando se produce un hecho relevante en Europa, nos piden ayuda. La BNF nos pidió que guardásemos todo lo relacionado con el atentado contra “Charlie Hebdo” para ver cómo se reflejaba en los medios españoles el suceso. Nosotros le pedimos lo mismo con la abdicación y la proclamación».

Podríamos pensar que todo esto no tiene nada que ver con el tradicional trabajo de un bibliotecario. Sin embargo es esencial. Y todo lo demás continúa haciéndose. «El cambio que vivimos con la ley me lo imagino como el principio de algo, la punta de un iceberg. Tenemos que realizar la misma labor que las bibliotecas nacionales hacemos desde hace cientos de años: preservar el conocimiento, sea cual sea el soporte en que se produzca», dice.

Hay muy pocas instituciones que sean más llamativamente «vigas del Estado». En opinión de Ana Santos, las podemos contar con los dedos de una mano, y la BNE es una de ellas sin duda. En el Congreso se ha visto. Las Comunidades Autónomas deben ver aquí un servicio. Se recoge la cultura que se genera en su comunidad y está a su servicio, al servicio común».

Ana Santos: «El Big Data español está aquí, en la Biblioteca Nacional»

Comentarios
0
Comparte esta noticia por correo electrónico

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Reporta un error en esta noticia

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Muchas gracias por tu participación