CAT (Curator Archiving Tool): improving access to web archives

Other title

CAT (Curator Archiving Tool): millorant l'accés als arxius web

Author

Llueca, Ciro

Cócera, Daniel

Torres, Natalia

Suades Méndez, Gerard

Vega, Ricard de la

Other authors

Biblioteca de Catalunya

Centre de Supercomputació de Catalunya

Publication date

2010-09-16T11:07:10Z



Abstract

PADICAT is the web archive created in 2005 in Catalonia (Spain ) by the Library of Catalonia (BC ) , the National Library of Catalonia , with the aim of collecting , processing and providing permanent access to the digital heritage of Catalonia . Its harvesting strategy is based on the hybrid model ( of massive harvesting . SPA top level domain ; selective compilation of the web site output of Catalan organizations; focused harvesting of public events) . The system provides open access to the whole collection , on the Internet . We consider necessary to complement the current search for new and visualization software with open source software tool, CAT ( Curator Archiving Tool) , composed by three modules aimed to effectively managing the processes of human cataloguing ; to publish directories where the digital resources and special collections ; and to offer statistical information of added value to end users. Within the framework of the International Internet Preservation Consortium meeting ( Vienna 2010) , the progress in the development of this new tool, and the philosophy that has motivated his design, are presented to the international community.


PADICAT és l’arxiu web creat el 2005 a Catalunya (Espanya) amb l’objectiu de capturar, processar i donar accés permanent al patrimoni digital de Catalunya. Basa la seva estratègia de captura en el model híbrid (captura massiva del domini .cat; captura selectiva dels agents productors de les pàgines web catalanes; captura focalitzada d’esdeveniments públics). El sistema ofereix la seva col·lecció en obert, a Internet. Per fer-ho de manera òptima ha cregut necessari complementar els actuals programes de cerca i visualització amb una nova eina de programari lliure, CAT (Curator Archiving Tool), formada per tres mòduls orientats a gestionar eficaçment els processos de catalogació humana; publicar els recursos en directoris i centres d’interès temàtic; i oferir als usuaris informació estadística de valor afegit. En el marc de l’International Internet Preservation Consortium meeting (Viena 2010) es presenta a la comunitat internacional els avenços en la producció d’aquesta nova eina informàtica, i la filosofia que n’ha causat el disseny.

Document Type

Object of conference

Language

Catalan

English

CDU Subject

004 - Computer science and technology. Computing. Data processing; 02 - Librarianship

Subject

Arxius web; Biblioteques digitals; Accessibilitat web

Pages

6

538277 bytes

530377 bytes

Documents

Padicat_iipc_2010_ENG.pdf

517.9Kb

Padicat_iipc_2010_CAT.pdf

525.6Kb

Padicat_iipc_2010_ESP.pdf

525.5Kb

 

Rights

Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i la Biblioteca de Catalunya i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)

This item appears in the following Collection(s)