Abstract:
|
En aquest document es presenta una aplicació que facilita la generació automàtica d'índexs bibliogràfics en format BibTeX a partir de col·leccions d'articles científics en PDF. Aquesta és una tasca que han dur a terme les persones que realitzen treballs de recerca per així poder incloure referències a altres documents dins de les seves publicacions, un procés pesat, repetitiu i que, si s'ha de fer manualment, requereix molt de temps. S'ha dividit la feina en tres grans parts: la cerca a les biblioteques digitals per trobar referències dels articles, l'extracció d'informació estructurada de pàgines HTML i la creació d'aquestes regles d'extracció fent servir exemples. |