Universitat Politècnica de Catalunya. Departament d'Enginyeria Electrònica
Soria Pérez, José Antonio
2025-07-08
Las tareas de visión por computador, como la detección de personas, están llamadas a convertirse en herramientas fundamentales para el análisis de multitudes y la gestión de espacios públicos en el futuro próximo. Sin embargo, los modelos actuales de detección de objetos aún requieren mejoras significativas para ser plenamente aplicables en entornos reales funcionando, además, en tiempo real. El objetivo de este trabajo ha sido entrenar modelos para la detección de personas basados en imágenes tomadas desde drones, orientado al análisis de muchedumbres, documentando la metodología llevada a cabo para servir de base en futuras investigaciones y desarrollos. Los modelos tratan de detectar personas en secuencias de vídeo optimizando la precisión dentro de las limitaciones impuestas por los datos y el entorno de aplicación. Se han comparado dos enfoques principales: FASTER R-CNN y YOLO, utilizando imágenes de 1280x720 píxeles, obtenidas de la base de datos VisDrone juntamente con un dataset personalizado. Los mejores resultados se han obtenido con la arquitectura YOLO, que ha superado a FASTER R-CNN tanto en precisión como en recall y velocidad de procesamiento. El modelo YOLO 3, entrenado específicamente para la detección de personas, alcanzó una precisión de 0.7036, un recall de 0.55209, un mAP50 de 0.60724 y un mAP50-95 de 0.29631, con una velocidad de 11.12 FPS. Aunque este modelo aún no está listo para su despliegue en aplicaciones reales, el trabajo realizado define un camino claro para su mejora y adaptación a distintos escenarios. El hecho de centrarse únicamente en la clase “persona” ha permitido optimizar el modelo para este caso de uso concreto, haciéndolo más práctico y eficiente que otros modelos generalistas. Además, se han identificado varias líneas de trabajo futuro, como la integración del sistema en drones para el análisis aéreo de multitudes, la optimización para dispositivos con recursos limitados, o la ampliación a la detección de comportamientos anómalos, entre otras aplicaciones con UAVs
Bachelor thesis
Spanish
Àrees temàtiques de la UPC::Informàtica::Automàtica i control; Drone aircraft; Vision artificielle (Robotique); Artificial intelligence; Deep learning (Machine learning); Machine learning; Avions no tripulats; Visió artificial (Robòtica); Intel·ligència artificial; Aprenentatge profund; Aprenentatge automàtic
Universitat Politècnica de Catalunya
Open Access
Treballs acadèmics [82541]