Intel·ligència artificial per a la classificació varietal de vins mitjançant anàlisi de textos

Martínez Atarés, Abril

Intel·ligència artificial per a la classificació varietal de vins mitjançant anàlisi de textos

dc.contributor

Universitat Politècnica de Catalunya. Departament de Ciències de la Computació

dc.contributor

Talavera Méndez, Luis José

dc.contributor.author

Martínez Atarés, Abril

dc.date.accessioned

2026-03-04T04:34:52Z

dc.date.available

2026-03-04T04:34:52Z

dc.date.issued

2026-01-29

dc.identifier

https://hdl.handle.net/2117/456585

dc.identifier

PRISMA-202488

dc.identifier.uri

https://hdl.handle.net/2117/456585

dc.description.abstract

Aquest Treball Final d’Estudis presenta un estudi comparatiu sobre l’aplicació de tècniques de Processament del Llenguatge Natural i Machine Learning a la classificació de textos, utilitzant com a cas d’estudi un conjunt de dades de ressenyes de vins. El treball se centra en la predicció de la varietat de raïm a partir de descripcions textuals, analitzant diferents estratègies de representació del llenguatge i models de classificació, des d’enfocaments tradicionals fins a models de llenguatge basats en arquitectures Transformer. Per assolir aquest objectiu, el treball es desenvolupa seguint dues aproximacions complementàries. En primer lloc, s’apliquen mètodes clàssics de representació textual basats en tokenització i vectorització mitjançant TF-IDF, combinats amb classificadors tradicionals com Multinomial Naive Bayes, amb la finalitat d’establir una línia base de rendiment. En segon lloc, s’estudia l’ús de models basats en Transformers, utilitzant tant embeddings preentrenats amb Sentence-BERT com models amb fine-tuning complet basats en RoBERTa, aprofitant arquitectures i pesos entrenats prèviament sobre grans corpus textuals. La metodologia emprada inclou la preparació i divisió del conjunt de dades, l’entrenament dels diferents models i l’avaluació mitjançant mètriques habituals en problemes de classificació multiclasse, com ara accuracy, precision, recall i f1-macro. Aquest enfocament permet analitzar de manera sistemàtica les diferències de rendiment, capacitat de captació semàntica i cost computacional entre els models clàssics i els basats en deep learning. Els resultats obtinguts mostren que els models basats en Transformers ofereixen, en general, un millor rendiment en la classificació de varietats de raïm, especialment en termes de comprensió semàntica de les descripcions textuals, tot i requerir un major cost computacional. Alhora, els models tradicionals presenten un comportament robust i eficient, constituint una alternativa vàlida en entorns amb recursos limitats. Finalment, el treball conclou que la combinació d’ambdós enfocaments proporciona una visió completa del problema i permet comprendre els avantatges i limitacions de cada model, establint una base per a futurs estudis i ampliacions en l’àmbit de la classificació de text.

dc.format

application/x-rar-compressed

dc.format

application/pdf

dc.language

cat

dc.publisher

Universitat Politècnica de Catalunya

dc.rights

Open Access

dc.subject

Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial

dc.subject

Machine learning

dc.subject

Natural language processing (Computer science)

dc.subject

Aprenentatge automàtic

dc.subject

Tractament del llenguatge natural (Informàtica)

dc.title

Intel·ligència artificial per a la classificació varietal de vins mitjançant anàlisi de textos

dc.type

Bachelor thesis

Fitxers en aquest element

Fitxers	Grandària	Format	Visualització
No hi ha fitxers associats a aquest element.

Aquest element apareix en la col·lecció o col·leccions següent(s)

Treballs acadèmics [82075]