miércoles, 22 de mayo de 2013





La BNE lleva a cabo su octava recolección de la web española





L.M.A.

La Biblioteca Nacional de España realizará desde finales de mayo y durante el mes de junio la octava recolección masiva del dominio .es con la colaboración de Internet Archive, institución sin ánimo de lucro y pionera en el campo de los archivos web.

A la espera de la promulgación del Real Decreto que regule el Depósito Legal electrónico –que se encuentra en fase de tramitación-, la BNE ha firmado un convenio con Red.es para la construcción de un repositorio digital que permita preservar el patrimonio documental en línea, misión en la que se viene trabajando desde el año 2009.

En ese año, la Biblioteca inició el sistema de preservación de los contenidos digitales españoles albergados bajo el dominio .es. Desde entonces, se han llevado a cabo siete recolecciones masivas de este dominio, siguiendo la tendencia de otras bibliotecas nacionales de garantizar en primer lugar la protección de los respectivos dominios nacionales, y dos recolecciones selectivas, una sobre las Elecciones Generales del 20 de noviembre de 2011 y  otra con recursos españoles destacados en el ámbito de las Humanidades.

La novedad de esta octava recolección masiva la constituye el hecho de ser la primera para la que se cuenta con el listado de más de un millón seiscientos mil nombres de dominio de Internet bajo el código de país .es. Este listado, proporcionado por Red.es gracias al convenio firmado entre dicha entidad pública y la Biblioteca, es el que utilizará el robot de captura como guía para recolectar todas las páginas y sitios web alojados en el dominio .es.
También se va a elaborar, en colaboración con las Comunidades Autónomas, un listado que contenga alrededor de unas 1.000 URL consideradas de especial importancia, y que interesa que sean recolectadas con especial detenimiento y calidad por el robot.

En la actualidad el Archivo de la Web Española reúne más de 85 TB de información comprimida en formato WARC (Web Archive file format, estándar internacional ISO 28500), una clase de archivo utilizado globalmente para estructurar, gestionar y almacenar objetos digitales. Y se espera que después de esta octava recolección alcance los 120-130TB.

Para más información consulte: http://www.bne.es/es/AreaPrensa/


No hay comentarios: