Predictive machine learning models for match outcomes in taekwondo based on competitive history

Ver/
Resumen
(application/pdf: 210.0Kb)
(application/pdf: 210.0Kb)
Trabajo
(application/pdf: 257.2Kb)
(application/pdf: 257.2Kb)
Autorización
(application/pdf: 324.9Kb)
(application/pdf: 324.9Kb)
Reporte de similitud
(application/pdf: 425.6Kb)
(application/pdf: 425.6Kb)
Fecha
2025Asesor(es)
Metadatos
Mostrar el registro completo del ítemResumen
El presente estudio abordó la predicción de resultados en combates de taekwondo, un
deporte olímpico caracterizado por la velocidad, la fuerza y la estrategia, en el cual el uso de
modelos predictivos basados en datos históricos es aún limitado. El objetivo principal fue
identificar variables técnicas y contextuales determinantes y evaluar el rendimiento de ocho
modelos de aprendizaje automático y profundo Random Forest, SVM, XGBoost, LightGBM,
MLP, LSTM, GRU y Transformer para predecir resultados de combates. Se recopiló información
oficial de la Federación Deportiva Peruana de Taekwondo correspondiente a los años 2023 y 2024,
generando un dataset con 2,256 registros y 42 variables, estructurado en dos formatos: (i)
secuencial, basado en tres combates consecutivos por atleta, y (ii) comparaciones por pares. La
investigación adoptó un enfoque cuantitativo, aplicando técnicas de preprocesamiento como
codificación de variables, eliminación de correlaciones y optimización de hiperparámetros
mediante GridSearchCV y validación cruzada. Los resultados evidenciaron que LightGBM
obtuvo el mejor rendimiento en el dataset secuencial, alcanzando un F1-score de 84 %, mientras
que XGBoost lideró en el dataset de pares con un F1-score de 75 %. El análisis de importancia de
características reveló que los puntos limpios y las penalizaciones en la segunda ronda fueron los
factores más influyentes para la predicción. Estos hallazgos demuestran que los modelos de
machine learning pueden complementar el juicio de entrenadores y expertos, proporcionando una
herramienta de apoyo para la selección de atletas, la planificación de entrenamientos y la toma de
decisiones estratégicas en competiciones de alto rendimiento. This study addressed the prediction of match outcomes in taekwondo, an Olympic sport
characterized by speed, strength, and tactical precision, where the application of predictive models based on historical data is still limited. The main objective was to identify the most influential
technical and contextual variables and to evaluate the performance of eight machine learning and
deep learning models—Random Forest, SVM, XGBoost, LightGBM, MLP, LSTM, GRU, and
Transformer—in predicting match outcomes. Official data from the Peruvian Taekwondo Sports Federation for the years 2023 and 2024 were collected, resulting in a dataset of 2,256 records and 42 variables, structured into two formats: (i) sequential, based on three consecutive matches per athlete, and (ii) pairwise confrontations. The study followed a quantitative approach, applying
preprocessing techniques such as variable encoding, correlation filtering, and hyperparameter
optimization using GridSearchCV and cross-validation. Results showed that LightGBM achieved
the highest performance in the sequential dataset, with an F1-score of 84%, while XGBoost performed best in the pairwise dataset with an F1-score of 75%. Feature importance analysis revealed that clean points and penalties in the second round were the most influential factors for prediction. These findings demonstrate that machine learning models can complement expert judgment, offering a valuable tool for athlete selection, training planning, and strategic decisionmaking in high-performance taekwondo competitions.
Editor
Universidad de LimaTemas
Coleccion(es)
- Tesis [68]
