Mostrar el registro sencillo del ítem

dc.contributor.advisorRamos Ponce, Oscar Efraín
dc.contributor.authorCabezas Diaz, Adriana
dc.contributor.authorGutierrez Sisniegas, Jerome Zack Ricardo
dc.date.accessioned2024-06-21T13:13:16Z
dc.date.available2024-06-21T13:13:16Z
dc.date.issued2023
dc.identifier.citationCabezas Diaz, A., & Gutierrez Sisniegas, J. Z. R. (2023). Detección de phishing en correos electrónicos mediante procesamiento de lenguaje natural del contenido y URLs ofuscadas [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio Institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/20761es_PE
dc.identifier.urihttps://hdl.handle.net/20.500.12724/20761
dc.description.abstractEl phishing es un tipo de fraude informático común que, por medio de mensajes como correos electrónicos o similar, solicita el ingreso de información personal o el acceso a enlaces maliciosos. Frente a esta problemática, distintos autores han desarrollado modelos de detección de phishing en correos electrónicos basados en análisis de contenido que han demostrado tener altas tasas de detección. Sin embargo, los ciberdelincuentes aplican nuevas técnicas de phishing como el uso de URLs ofuscadas, que consiste en modificar la URL maliciosa para que parezca legítima mediante distintos métodos, como acortar la URL. La presente investigación tiene por objetivo general desarrollar dos métodos de detección de phishing en correos electrónicos mediante procesamiento de lenguaje natural, el primero enfocado en el análisis del contenido y el segundo enfocado en el análisis de URLs ofuscadas. Asimismo, se busca determinar cuál método incrementa la tasa de detección de phishing. Ambos modelos tienen una fase de preprocesamiento que extrae un conjunto de atributos relativos al contenido del correo electrónico y aplica técnicas de procesamiento de lenguaje natural sobre el contenido del correo electrónico. Para el entrenamiento de los modelos, se utilizaron tres datasets: “Enron”, “Spam Archive” y “Ebbu 2017”. Para la validación de los modelos, se tomaron en cuenta las métricas de precisión, sensibilidad, exactitud y puntaje del área debajo de la curva (AUC). Los modelos implementados lograron una precisión máxima del 97.02% y 98.70%. Además, se observó que los modelos propuestos presentaron resultados con una diferencia mínima para detectar phishing en correos electrónicos.es_PE
dc.description.abstractPhishing is a common type of computer fraud that, through methods like emails or similar messages, requests the input of personal information or access to malicious links. Faced with this issue, various authors have developed email phishing detection models based on content analysis that have demonstrated high detection rates. However, cybercriminals employ new phishing techniques such as the use of obfuscated URLs, which involve modifying malicious URLs to appear legitimate through various methods, such as URL shortening. The present research aims to develop two general methods for detecting phishing in emails using natural language processing. The first method focuses on content analysis, while the second concentrates on analyzing obfuscated URLs. Likewise, the objective is to determine which method enhances the phishing detection rate. Both models involve a preprocessing phase that extracts a set of attributes related to email content and applies natural language processing techniques to the email content. Three datasets, namely "Enron," "Spam Archive," and "Ebbu 2017," were used for model training. To validate the models, metrics such as precision, sensitivity, accuracy, and the area under the curve (AUC) score were considered. The implemented models achieved a maximum precision of 97.02% and 98.70%. Additionally, it was observed that the proposed models yielded results with minimal differences in detecting phishing in emails.en_EN
dc.formatapplication/pdf
dc.language.isospa
dc.publisherUniversidad de Lima
dc.rightsinfo:eu-repo/semantics/openAccess*
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.sourceRepositorio Institucional Ulimaes_PE
dc.sourceUniversidad de Limaes_PE
dc.subjectPendienteen_EN
dc.subjectPendientees_PE
dc.titleDetección de phishing en correos electrónicos mediante procesamiento de lenguaje natural del contenido y URLs ofuscadases_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
thesis.degree.disciplineIngeniería de Sistemases_PE
thesis.degree.grantorUniversidad de Lima. Facultad de Ingenieríaes_PE
thesis.degree.levelTitulo profesionales_PE
dc.type.otherTesis
thesis.degree.nameIngeniero de Sistemases_PE
dc.publisher.countryPE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.02.04
renati.author.dni74847343
renati.author.dni75414327
renati.advisor.orcidhttps://orcid.org/0000-0001-5185-9745
renati.advisor.dni44196581
renati.jurorDávila Calle, Guillermo Antonio
renati.jurorDiaz Parra, Jose Raul
renati.jurorMore Sanchez, Javier
renati.jurorRamos Ponce, Oscar Efrain
renati.levelhttp://purl.org/pe-repo/renati/level#tituloProfesional*
renati.typehttps://purl.org/pe-repo/renati/type#tesis*
renati.discipline612076
ulima.catOI


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess
Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess