To access the full text documents, please follow this link: http://hdl.handle.net/2099.1/19556

Pla de carrera
Càlvez Castro, Mireia
Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics; Catala Roig, Neus; Pou, Marc
Aquest projecte és per ajudar a qualsevol persona a orientar la seva carrera professional mitjançant els currículums registrats a Infojobs. D’aquests currículums ens interessa dos apartats principals: les experiències desenvolupades i els estudis realitzats durant la trajectòria professional. La ordenació cronològica d'aquestes dues relacions ens descriuen quins passos s’han dut a terme una persona al llarg de la vida fins arribar al punt present. Actualment, a Espanya no existeixen serveis d'informació i coneixement com els que es descriuen en aquest projecte, però hi ha agregadors de feina internacionals que tenen algunes semblances però no ens serveixen pel mercat Espanyol perquè la informació que mostren és d’altres països i tenen les seves pròpies dinàmiques, característiques i nomenclatures dels llocs de treball. Per tant, podem concloure que aquest projecte és pioner al nostre país. La nostra web és un portal on es mostraran gràfiques que descriuen els patrons de comportament dels llocs de treball, dels centres de formació, les empreses i els estudis a nivell estadístic. Ja que el projecte que es desenvolupa és per InfoJobs hi ha cert condicionament en algunes de les eines i tecnologies a utilitzar, algunes d’aquestes són: - “Highcharts”: llibreria que permet la representació i la càrrega de gràfics de forma dinàmica mitjançant “jQuery”. - Aplicació web: s’ha utilitzat Java i el template Spring. - Base de dades de grafs: s’ha utilitzat neo4j (base de dades no relacional). Un dels factors clau del projecte és la capacitat d'agregar informació per poder extreure'n el coneixement que gira al voltant d'aquests quatre camps d'informació que trobem en la secció d’experiències del currículum d'InfoJobs: professió (lloc de treball), nom d'empresa, centre de formació i estudis. En aquests camps es dóna l’opció de introduir valors lliures, fet que fa que la informació no pugui ser tractada de forma directa ja que hi trobem: - Gran disparitat d'informació. - Valors semànticament equivalents. - Valors similars escrits. Això ha provocat que s’hagi d'incloure un apartat inicial de neteja d'informació. A efectes de determinar la viabilitat del projecte s’ha considerat que hi hagi: - Volum de dades suficient per extreure patrons de comportament. - Qualitat i consistència de la informació. - Normalització dels camps, és a dir, conversió a majúscules, eliminació de signes de puntuació (accents, dièresis, punts, comes, …), substitució de caràcters especials (ñ, º, ª,), eliminació d'espais inicials i finals, eliminació de números, eliminació de “stopwords” (articles, preposicions, …), substitució de sinònims i aplicació d'expressions regulars. - Modelització del domini en un graf amb la ordenació cronològica de les experiències i estudis per tal de poder determinar de forma correcta la carrera professional. - Procés de càrrega del graf utilitzant el fitxers de dades que han estat prèviament tractats pel procés de normalització que consta de: a.- Explotació del graf utilitzant el conjunt d’Apis que ofereix la BBDD neo4j. b.- Presentació de resultats. Pel que fa al projecte, es durà a terme un desenvolupament iteratiu i incremental de manera que ens anem acostant a la solució global de projecte a partir de cicles de desenvolupament.
Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació
Data mining
Neo4j
Agregadors
Web
Experiències
Currículum
Infojobs
Highcharts
jQuery
Normalització
Api
Mineria de dades
info:eu-repo/semantics/bachelorThesis
Universitat Politècnica de Catalunya
         

Show full item record

 

Coordination

 

Supporters