| dc.contributor.advisor | Suni López, Franci | |
| dc.contributor.author | Heredia Soto, Maria Fernanda | |
| dc.date.accessioned | 2025-12-02T18:03:16Z | |
| dc.date.available | 2025-12-02T18:03:16Z | |
| dc.date.issued | 2025 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12724/23707 | |
| dc.description.abstract | This work addresses the development of an early corruption detection system using advanced data analysis and artificial intelligence algorithms. The system uses open data collected from the Anti-Corruption Observatory of Peru’s Comptroller General’s Office. A dataset of 2815 public entities evaluated through the “Índice de Riesgos de la Corrupción e Inconducta Funcional”, with scores ranging from 0 to 100, was structured. The primary task involved classification into six risk levels, from very low to very high. Histogram-based Gradient Boosting (HGB) was applied, achieving an accuracy of 89.6%. Regression tasks on the raw INCO scores and experiments with Large Language Models were also conducted. The system represents an early stage, yet scalable, tool to support public sector transparency. Future work proposes the integration of explainable AI for improved transparency and real-time policy support. | en_EN |
| dc.description.abstract | Este trabajo aborda el desarrollo de un sistema de detección temprana de corrupción utilizando análisis de datos avanzados y algoritmos de inteligencia artificial. El sistema emplea datos abiertos recolectados del Observatorio Anticorrupción de la Contraloría General de la República del Perú. Se estructuró un conjunto de datos con 2815 entidades públicas evaluadas mediante el “Índice de Riesgos de la Corrupción e Inconducta Funcional”, con puntajes que varían entre 0 y 100. La tarea principal consistió en la clasificación en seis niveles de riesgo, desde muy bajo hasta muy alto. Se aplicó el algoritmo Histogram-based Gradient Boosting (HGB), logrando una precisión del 89.6%. También se realizaron tareas de regresión sobre los puntajes brutos del INCO y experimentos con Modelos de Lenguaje de Gran Escala. El sistema representa una herramienta temprana, pero escalable, para apoyar la transparencia en el sector público. Como trabajo futuro se propone la integración de inteligencia artificial explicable para mejorar la transparencia y el soporte a políticas en tiempo real. | es_PE |
| dc.format | application/pdf | |
| dc.language.iso | eng | |
| dc.publisher | Universidad de Lima | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | * |
| dc.subject | Pendiente | es_PE |
| dc.title | Early Corruption Detection System Using Machine Learning Algorithms | es_PE |
| dc.type | info:eu-repo/semantics/bachelorThesis | |
| thesis.degree.level | Título profesional | |
| thesis.degree.discipline | Ingeniería de Sistemas | |
| thesis.degree.grantor | Universidad de Lima. Facultad de Ingeniería | |
| dc.publisher.country | PE | |
| dc.type.other | Tesis | |
| thesis.degree.name | Ingeniero de Sistemas | |
| renati.advisor.orcid | https://orcid.org/0000-0002-4212-7910 | |
| renati.discipline | 612076 | |
| dc.identifier.isni | 0000000121541816 | |
| renati.author.dni | 73706895 | |
| renati.level | https://purl.org/pe-repo/renati/level#tituloProfesional | |
| renati.advisor.dni | 70616223 | |
| renati.juror | Guzman Jimenez, Rosario Marybel | |
| renati.juror | Ramirez Cerna, Lourdes | |
| renati.juror | Suni López, Franci | |
| renati.type | https://purl.org/pe-repo/renati/type#tesis | |
| dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#2.11.04 | |
| ulima.cat | OI | |