To access the full text documents, please follow this link: http://hdl.handle.net/10609/8562

Repurposing Social Tagging Data for Extraction of Domain-level Concepts
Purao, Sandeep; Casas Roma, Joan; Minguillón Alfonso, Julià; Conesa Caralt, Jordi; Sugumaran, Vijayan; Storey, Veda
The World Wide Web, the world¿s largest resource for information, has evolved from organizing information using controlled, top-down taxonomies to a bottom up approach that emphasizes assigning meaning to data via mechanisms such as the Social Web (Web 2.0). Tagging adds meta-data, (weak semantics) to the content available on the web. This research investigates the potential for repurposing this layer of meta-data. We propose a multi-phase approach that exploits user-defined tags to identify and extract domain-level concepts. We operationalize this approach and assess its feasibility by application to a publicly available tag repository. The paper describes insights gained from implementing and applying the heuristics contained in the approach, as well as challenges and implications of repurposing tags for extraction of domain-level concepts.
La World Wide Web, el recurso más grande del mundo de la información, ha pasado de taxonomías controladas de arriba abajo a un enfoque de abajo arriba que hace hincapié en la asignación de significado a los datos a través de mecanismos tales como la web social (web 2.0). El etiquetado añade meta-datos (semántica débil) a los contenidos disponibles en la web. Esta investigación estudia las posibilidades de reutilización de esta capa de meta-datos. Nosotros proponemos un enfoque de múltiples fases que explota las etiquetas definidas por el usuario para identificar y extraer los conceptos de nivel de dominio. Ponemos en práctica este enfoque y evaluamos su viabilidad mediante la aplicación a un repositorio de etiquetas a disposición del público. El documento describe los conocimientos adquiridos a partir de la implementación y aplicación de la heurística que figura en el enfoque, así como los retos y las implicaciones de reutilización de etiquetas para la extracción de los conceptos de nivel de dominio.
La World Wide Web, el recurs més gran del món de la informació, ha passat de taxonomies controlades de dalt a baix a un enfocament de baix a dalt que posa èmfasi en l'assignació de significat a les dades a través de mecanismes tals com la web social (web 2.0). L'etiquetatge afegeix metadades (semàntica dèbil) als continguts disponibles a la web. Aquesta investigació estudia les possibilitats de reutilització d'aquesta capa de metadades. Nosaltres proposem un enfocament de múltiples fases que explota les etiquetes definides per l'usuari per identificar i extreure els conceptes de nivell de domini. Posem en pràctica aquest enfocament i avaluem la seva viabilitat mitjançant l'aplicació a un repositori d'etiquetes a disposició del públic. El document descriu els coneixements adquirits a partir de la implementació i aplicació de l'heurística que consta a l'enfocament, així com els reptes i implicacions de reutilització d'etiquetes per l'extracció dels conceptes de nivell de domini.
2014-05-15
taxonomies
web 2.0
meta-data
tags
taxonomías
web 2.0
metadatos
etiquetas
taxonomies
web 2.0
metadades
etiquetes
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Part of book or chapter of book
         

Show full item record

Related documents

Other documents of the same author

Minguillón Alfonso, Julià; Conesa Caralt, Jordi; Rodríguez González, M. Elena
Minguillón Alfonso, Julià; Conesa Caralt, Jordi; Rodríguez González, M. Elena
Conesa Caralt, Jordi; Rodríguez González, M. Elena; Minguillón Alfonso, Julià
 

Coordination

 

Supporters