CAT (Curator Archiving Tool): improving access to web archives

Altres títols

CAT (Curator Archiving Tool): millorant l'accés als arxius web

Autor/a

Llueca, Ciro

Cócera, Daniel

Torres, Natalia

Suades Méndez, Gerard

Vega, Ricard de la

Altres autors/es

Biblioteca de Catalunya

Centre de Supercomputació de Catalunya

Data de publicació

2010-09-16T11:07:10Z



Resum

PADICAT is the web archive created in 2005 in Catalonia (Spain ) by the Library of Catalonia (BC ) , the National Library of Catalonia , with the aim of collecting , processing and providing permanent access to the digital heritage of Catalonia . Its harvesting strategy is based on the hybrid model ( of massive harvesting . SPA top level domain ; selective compilation of the web site output of Catalan organizations; focused harvesting of public events) . The system provides open access to the whole collection , on the Internet . We consider necessary to complement the current search for new and visualization software with open source software tool, CAT ( Curator Archiving Tool) , composed by three modules aimed to effectively managing the processes of human cataloguing ; to publish directories where the digital resources and special collections ; and to offer statistical information of added value to end users. Within the framework of the International Internet Preservation Consortium meeting ( Vienna 2010) , the progress in the development of this new tool, and the philosophy that has motivated his design, are presented to the international community.


PADICAT és l’arxiu web creat el 2005 a Catalunya (Espanya) amb l’objectiu de capturar, processar i donar accés permanent al patrimoni digital de Catalunya. Basa la seva estratègia de captura en el model híbrid (captura massiva del domini .cat; captura selectiva dels agents productors de les pàgines web catalanes; captura focalitzada d’esdeveniments públics). El sistema ofereix la seva col·lecció en obert, a Internet. Per fer-ho de manera òptima ha cregut necessari complementar els actuals programes de cerca i visualització amb una nova eina de programari lliure, CAT (Curator Archiving Tool), formada per tres mòduls orientats a gestionar eficaçment els processos de catalogació humana; publicar els recursos en directoris i centres d’interès temàtic; i oferir als usuaris informació estadística de valor afegit. En el marc de l’International Internet Preservation Consortium meeting (Viena 2010) es presenta a la comunitat internacional els avenços en la producció d’aquesta nova eina informàtica, i la filosofia que n’ha causat el disseny.

Tipus de document

Objecte de conferència

Llengua

Català

Anglès

Matèries CDU

004 - Informàtica; 02 - Biblioteconomia. Documentació

Paraules clau

Arxius web; Biblioteques digitals; Accessibilitat web

Pàgines

6

538277 bytes

530377 bytes

Documents

Padicat_iipc_2010_ENG.pdf

517.9Kb

Padicat_iipc_2010_CAT.pdf

525.6Kb

Padicat_iipc_2010_ESP.pdf

525.5Kb

 

Drets

Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i la Biblioteca de Catalunya i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)

Aquest element apareix en la col·lecció o col·leccions següent(s)