Comparativa de modelos backbone en la identificación de especies de aves peruanas

Ver/
Descargar
(application/pdf: 1.033Mb)
(application/pdf: 1.033Mb)
Autorización
(application/pdf: 240.0Kb)
(application/pdf: 240.0Kb)
Reporte de similitud
(application/pdf: 1.815Mb)
(application/pdf: 1.815Mb)
Fecha
2025Autor(es)
Asesor(es)
Metadatos
Mostrar el registro completo del ítemResumen
El tráfico de vida silvestre persiste en todo el mundo a pesar de dos décadas de acción concertada.
El problema continúa, impulsado por la demanda interna y externa. A pesar de los esfuerzos a
través de operativos policiales, se requiere de herramientas para mejorar la recolección de datos y
la coordinación entre entidades para una lucha más efectiva contra este delito. Esta investigación
tiene como objetivo ayudar en la clasificación de las aves por especies en peligro de extinción a
través de la identificación del modelo backbone (DenseNet121, Restnet152, GoogleVit y
SwinTransformer). Para ello, se desarrolló un dataset que comprende 5.420 imágenes de 20
especies de aves peruanas, incluyendo aquellas clasificadas como en peligro de extinción,
vulnerables y otras especies. La arquitectura de la SwinTransformer obtuvo un 87% de precisión,
superando a DenseNet121 (78.8%), ResNet152V2 (77.5%) y GoogleVit (5%). El modelo
SwinTransformer podría ser de gran utilidad para los guardaparques y otras autoridades
competentes para facilitar la identificación rápida de especies protegidas que apoye el monitoreo
de puntos de control de tráfico ilegal de aves del Perú. Despite two decades of concerted action, wildlife trafficking persists worldwide. The problem
continues, driven by both domestic and international demand. Despite ongoing efforts through
law-enforcement operations, additional tools are required to improve data collection and enhance
coordination among institutions to enable a more effective response to this crime. The goal of this
research is to help classify endangered bird species by identifying the most effective backbone
model: DenseNet121, ResNet152, GoogleViT, or SwinTransformer. For this purpose, a dataset
comprising 5,420 images of 20 Peruvian bird species including endangered, vulnerable, and other
species was developed. The Swin Transformer architecture achieved an accuracy of 87%,
outperforming DenseNet121 (78.8%), ResNet152V2 (77.5%), and GoogleViT (5%). The Swin
Transformer model could be highly useful for park rangers and other competent authorities by
enabling rapid identification of protected species, thereby supporting the monitoring of control
points related to the illegal trafficking of birds in Peru.
Editor
Universidad de LimaTemas
Coleccion(es)
- Tesis [76]

