Underwater plastic waste detection with yolo and vision transformer models

Ver/
Descargar
(application/pdf: 283.0Kb)
(application/pdf: 283.0Kb)
Autorización
(application/pdf: 326.7Kb)
(application/pdf: 326.7Kb)
Reporte de similitud
(application/pdf: 797.3Kb)
(application/pdf: 797.3Kb)
Fecha
2025Asesor(es)
Metadatos
Mostrar el registro completo del ítemResumen
La metodología implementada comprendió etapas esenciales como el preprocesamiento de datos, la configuración e implementación de los modelos y el entrenamiento mediante estrategias de aprendizaje por transferencia. La validación se llevó a cabo en un entorno de video simulado, seguida de un análisis comparativo de las métricas obtenidaEl desempeño de los modelos fue evaluado empleando indicadores como la precisión promedio (mAP), el recall y el tiempo de inferencia. Los resultados mostraron que YOLO v8 alcanzó un mAP50 de 0.921, un recall de 0.829 y un tiempo de inferencia de 14.1 milisegundos. En contraste, YOLO-NAS obtuvo un mAP50 de 0.813, un recall de 0.903 y un tiempo de 17.8 milisegundos. Finalmente, RT-DETR registró un mAP de 0.887, un recall de 0.819 y un tiempo de 15.9 milisegundos. Aunque RT-DETR no logró el mAP más elevado, demostró un desempeño más estable en condiciones submarinas simuladas, lo cual evidencia su potencial en sistemas de monitoreo ambiental automatizado This research addresses the global challenge of marine pollution, with particular emphasis on that generated by plastic waste. It applies real-time object detection methods powered by deep learning algorithms to identify plastic debris in underwater settings. A comparative analysis was performed among YOLO v8, YOLO-NAS, and RT-DETR models to assess their detection performance.The methodology comprised essential phases including data preprocessing, model configuration, and training using transfer learning techniques. Evaluation was conducted within a simulated video environment, followed by a comparative interpretation of the obtained outcomes.Model efficiency was measured through key indicators such as mean average precision (mAP), recall, and inference time. The YOLO v8 model achieved a mAP50 of 0.921, a recall of 0.829, and an inference time of 14.1 milliseconds. Conversely, YOLO-NAS obtained a mAP50 of 0.813, a recall of 0.903, and an inference time of 17.8 milliseconds. Lastly, RT-DETR reached a mAP of 0.887, a recall of 0.819, and an inference time of 15.9 milliseconds.Although RT-DETR did not record the highest mAP, it exhibited more consistent behavior in simulated underwater conditions, underlining its suitability for automated environmental monitoring systems.
Editor
Universidad de LimaTemas
Coleccion(es)
- Tesis [73]

