La
BNE lleva a cabo su octava recolección de la web española
La
Biblioteca Nacional de España realizará desde finales de mayo y durante el mes
de junio la octava recolección masiva del dominio .es con la colaboración de
Internet Archive, institución sin ánimo de lucro y pionera en el campo de los
archivos web.
A
la espera de la promulgación del Real Decreto que regule el Depósito Legal
electrónico –que se encuentra en fase de tramitación-, la BNE ha firmado un
convenio con Red.es para la construcción de un repositorio digital que permita
preservar el patrimonio documental en línea, misión en la que se viene
trabajando desde el año 2009.
En
ese año, la Biblioteca inició el sistema de preservación de los contenidos
digitales españoles albergados bajo el dominio .es. Desde entonces, se han
llevado a cabo siete recolecciones masivas de este dominio, siguiendo la
tendencia de otras bibliotecas nacionales de garantizar en primer lugar la
protección de los respectivos dominios nacionales, y dos recolecciones
selectivas, una sobre las Elecciones Generales del 20 de noviembre de 2011
y otra con recursos españoles destacados
en el ámbito de las Humanidades.
La
novedad de esta octava recolección masiva la constituye el hecho de ser la
primera para la que se cuenta con el listado de más de un millón seiscientos
mil nombres de dominio de Internet bajo el código de país .es. Este listado,
proporcionado por Red.es gracias al convenio firmado entre dicha entidad
pública y la Biblioteca, es el que utilizará el robot de captura como guía para
recolectar todas las páginas y sitios web alojados en el dominio .es.
También
se va a elaborar, en colaboración con las Comunidades Autónomas, un listado que
contenga alrededor de unas 1.000 URL consideradas de especial importancia, y
que interesa que sean recolectadas con especial detenimiento y calidad por el
robot.
En
la actualidad el Archivo de la Web Española reúne más de 85 TB de información
comprimida en formato WARC (Web Archive file format, estándar internacional ISO
28500), una clase de archivo utilizado globalmente para estructurar, gestionar
y almacenar objetos digitales. Y se espera que después de esta octava
recolección alcance los 120-130TB.
Para
más información consulte: http://www.bne.es/es/AreaPrensa/
No hay comentarios:
Publicar un comentario