Gender biases in professions: a machine learning – powered search engines analysis

Ver/
Tesis
(application/pdf: 321.9Kb)
(application/pdf: 321.9Kb)
Autorización
(application/pdf: 211.0Kb)
(application/pdf: 211.0Kb)
Reporte de similitud
(application/pdf: 2.241Mb)
(application/pdf: 2.241Mb)
Fecha
2024Asesor(es)
Metadatos
Mostrar el registro completo del ítemResumen
Machine learning is becoming increasingly important and pervasive in people's lives, yet when its conclusions reflect biases that support ingrained prejudices in society, many vulnerable groups' psychological wellbeing may be impacted. To investigate if gender biases exist in image search engine algorithms that use machine learning, the study focuses on occupations. To do this, searches for various professions were run on Google, DuckDuckGo, and Yandex. Using web scraping techniques, a sample of images was retrieved for each selected profession and search engine. The images were then manually classified by gender, and statistical indicators and analyses were computed to detect potential biases in the representation of each gender. This analysis included a comparison between search engines, the calculation of mean, standard deviation, and coefficient of variation, a confidence interval analysis, a logistic regression analysis, and a Chi-Square test. It was discovered that there is a strong association between men and leadership positions or STEM professions, while women are predominantly portrayed in traditionally female-associated professions. For instance, it was discovered that 100% of the search results for secretaries and nurses in Yandex are female, meanwhile 94% of the search results for engineers are male. Similar statistics may be found on DuckDuckGo, where 96% of results for mathematicians were men, and on Google, where 73% of results for teachers were women. These findings illuminate novel manifestations of gender prejudices in contemporary society and their potential to affect access to particular professions. El Machine Learning está adquiriendo cada vez más relevancia en la vida de las personas, pero cuando sus resultados reflejan sesgos sostenidos en prejuicios arraigados a la sociedad, el bienestar psicológico de múltiples grupos vulnerables puede verse afectado. Es por ello que la presente investigación tiene como objetivo determinar si existen sesgos de género en los algoritmos de motores de búsqueda de imágenes que utilizan Machine Learning. El estudio consistió en la búsqueda de diversas profesiones en Google, DuckDuckGo y Yandex. Utilizando técnicas de web scraping, se recuperó una muestra de imágenes para cada profesión seleccionada y motor de búsqueda. Posteriormente, las imágenes se clasificaron manualmente por género y mediante una serie de análisis estadísticos y cálculo de indicadores se comprobaron sesgos en la representación de cada género. Los análisis consistieron en una comparación de resultados entre los motores de búsqueda, cálculo de la media, desviación estándar y coeficiente de variación, análisis de intervalos de confianza, análisis de regresión logística y una prueba de Chi-Cuadrado. Se descubrió una fuerte asociación entre los hombres y los puestos de liderazgo o las profesiones STEM, mientras que las mujeres predominan en profesiones tradicionalmente asociadas a valores de cuidado y crianza (docencia, enfermería). Por ejemplo, se encontró que el 100% de los resultados de búsqueda para secretarias y enfermeras en Yandex son mujeres, mientras que el 94% de los resultados para ingenieros son hombres. Estadísticas similares se encontraron en DuckDuckGo, donde el 96% de los resultados para matemáticos eran hombres, y en Google, donde el 73% de los resultados para docentes eran mujeres. Estos hallazgos revelan manifestaciones de los prejuicios de género en la sociedad contemporánea y su potencial para afectar el acceso a determinadas profesiones.
Cómo citar
Tirado Vilela, N. A., & Ueunten Acevedo, A. M. (2024). Gender biases in professions: a machine learning – powered search engines analysis [Tesis para optar el Título Profesional de Ingeniero Industrial, Universidad de Lima]. Repositorio Institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/22198Editor
Universidad de LimaTemas
Coleccion(es)
- Tesis [1167]

