Models d'intel·ligència artificial per reconeixement d'imatge en un procés de control de qualitat

Other authors

Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial

Bolea Monte, Yolanda

Publication date

2026-01



Abstract

Aquest treball de fi de grau se centra a crear una eina que permeti detectar piscines en imatges aèries mitjançant visió de computador. Aquesta eina és una xarxa neuronal convolucional, concretament un model de YOLOv8 entrenat usant tant un conjunt de dades ja publicat com un generat i etiquetat manualment a partir d’una eina pública. Per l’elaboració d’aquest dataset final s’ha usat l’eina en línia Roboflow Universe, d’on s’ha obtingut un dataset molt gran (9.882 imatges) anomenat Pool Detection [1], aquest conjunt de dades ha necessitat revisió manual per adaptar-se a les necessitats del projecte. També s’ha ampliat mitjançant imatges extretes de la infraestructura de Dades Espacials de les Illes Balears (IDEIB) [2] que han estat etiquetades manualment usant el servei de Roboflow que permet crear i etiquetar datasets de manera molt clara així com inserir passos de data augmentation. Després del llarg procés, el conjunt definitiu conté 17.954 imatges de 512x512 píxels. On 10.476 imatges provenen del data augmentation i de les 7.478 restants, 485 han estat etiquetades a mà i 6.993 provenen de la base de dades pública. Un cop el dataset definitiu ha estat consolidat s’ha realitzat l’entrenament del model mitjançant YOLOv8 seguint amb la divisió de les imatges recomanada per la mateixa eina, 70% a TRAIN, 20% a VALID i 10% a TEST. Aquest entrenament realitzat mitjançant Python a l’eina Google Colab [3] s’ha realitzat amb un paràmetre de paciència de 25 èpoques, això significa que el mateix entrenament s’ha finalitzat en detectar que en 25 èpoques no millorava i retorna el model de l’època amb millor comportament. Una vegada fet això, s’ha escrit un programa de Python que extreu imatges des de l’IDEIB [2] i les analitza comptant el nombre de piscines. Funciona a partir del mapa del qual vols extreure imatges (l’any) i la zona que vols analitzar, en aquest cas s’ha generat un polígon usant l’eina QGIS [4] del perímetre del terme municipal de Santa Maria del Camí a Mallorca. El programa divideix les coordenades en rajoles a fi de cobrir tota l’àrea i estimar el nombre de piscines al municipi. Tot això permet analitzar com ha evolucionat al llarg dels anys el nombre de piscines en una àrea elegida i mostra el potencial del model i la seva aplicabilitat.

Document Type

Bachelor thesis

Language

Catalan

Publisher

Universitat Politècnica de Catalunya

Recommended citation

This citation was generated automatically.

Rights

Open Access

This item appears in the following Collection(s)