Publicación:
Aplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacer

dc.contributor.advisorMorales Ospina, Víctor Hugo
dc.contributor.advisorRomero Osorio, Fray
dc.contributor.authorMartínez López, Antonio José
dc.contributor.juryMorales Rivera, Mario Alfonso
dc.contributor.juryHerrera Guerra, Eugenia del Pilar
dc.date.accessioned2025-06-27T20:13:12Z
dc.date.available2025-06-27T20:13:12Z
dc.date.issued2025-06-27
dc.description.abstractEl bajo peso al nacer, definido por la OMS como menos de 2.500 gramos, incrementa el riesgo de complicaciones y mortalidad en recién nacidos. Este trabajo analizó factores de riesgo asociados al bajo peso al nacer en Medellín aplicando modelos de regresión logística clásica, penalizada y GAM, enfrentando el desbalance de datos mediante técnicas de oversampling como SMOTE. El uso de estas técnicas permitió mejorar la detección de casos críticos, logrando modelos más sensibles y precisos. Se identificó que comunas como Manrique, Popular y Robledo concentran la mayor incidencia, y que la talla al nacer y las semanas de gestación son factores clave asociados al riesgo. El estudio evidencia que, ante datos clínicos reales y complejos, el uso de métodos modernos combinados con enfoques clásicos aporta resultados más robustos para la salud pública.
dc.description.degreelevelPregrado
dc.description.degreenameEstadístico(a)
dc.description.modalityTrabajos de Investigación y/o Extensión
dc.description.notesEste documento analiza factores de riesgo asociados al bajo peso al nacer en Medellín, empleando modelos de regresión logística, técnicas de oversampling (SMOTE) y modelos semiparamétricos (GAM). Se identifican comunas con mayor incidencia y se destacan la talla y las semanas de gestación como factores clave. El oversampling mejoró la sensibilidad de los modelos frente al desbalance de datos.
dc.description.tableofcontents1. Introducción
dc.description.tableofcontents2. Estado del arte
dc.description.tableofcontents3. Marco teórico
dc.description.tableofcontents3.1. Determinantes sociales y clínicos del bajo peso al nacer
dc.description.tableofcontents3.2. Regresión Logística
dc.description.tableofcontents3.3. Definición del Modelo
dc.description.tableofcontents3.4. Estimación de parámetros de un modelo de regresión logística
dc.description.tableofcontents3.4.1. Estimadores de máxima verosimilitud
dc.description.tableofcontents3.5. Significancia de los efectos de las variables
dc.description.tableofcontents3.6. Diagnóstico del modelo
dc.description.tableofcontents3.7. Modelos Semiparamétricos
dc.description.tableofcontents3.7.1. Estimación y Propiedades
dc.description.tableofcontents3.8. Regresión Penalizada
dc.description.tableofcontents3.9. Oversampling y el método SMOTE
dc.description.tableofcontents3.10. Aprendizaje automático (Machine Learning, ML)
dc.description.tableofcontents3.10.1. Matriz de Confusión
dc.description.tableofcontents3.10.2. Métricas de Evaluación
dc.description.tableofcontents4. Metodología
dc.description.tableofcontents4.1. Tipo y diseño de investigación
dc.description.tableofcontents4.2. Población
dc.description.tableofcontents4.3. Tipo de Muestreo
dc.description.tableofcontents4.4. Variables
dc.description.tableofcontents5. Resultados y discusión
dc.description.tableofcontents5.1. Tipo de seguridad social
dc.description.tableofcontents5.2. Nivel educativo de la madre
dc.description.tableofcontents5.3. Semanas de gestación
dc.description.tableofcontents5.4. Edad materna
dc.description.tableofcontents5.4. Edad materna
dc.description.tableofcontents5.5. Tendencia anual de nacimientos registrados
dc.description.tableofcontents5.6. Distribución por sexo y justificación de la muestra analizada
dc.description.tableofcontents5.7. Mapas de calor elaborados a partir de la incidencia del bajo peso al nacer
dc.description.tableofcontents5.8. Regresión logística
dc.description.tableofcontents5.9. Modelo semiparamétrico aditivo generalizado (GAM)
dc.description.tableofcontents5.10. Métricas de desempeño de los diferentes modelos de clasificación
dc.description.tableofcontents5.10.1. Comparación de la capacidad discriminativa (AUC) entre modelos
dc.description.tableofcontents5.11. Regresión logística clásica
dc.description.tableofcontents5.12. Regresión logística penalizada (Ridge)
dc.description.tableofcontents5.13. Árbol de decisión (CART)
dc.description.tableofcontents6. Conclusiones
dc.description.tableofcontents7. Referencias
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad de Córdoba
dc.identifier.reponameRepositorio Universidad de Córdoba
dc.identifier.repourlhttps://repositorio.unicordoba.edu.co/
dc.identifier.urihttps://repositorio.unicordoba.edu.co/handle/ucordoba/9222
dc.language.isospa
dc.publisherUniversidad de Córdoba
dc.publisher.facultyFacultad de Ciencias Básicas
dc.publisher.placeMontería, Córdoba, Colombia
dc.publisher.programEstadística
dc.relation.referencesAbarca, R. E. (2001). Estimaciones paramétricas, semiparamétricas y no paramétricas en valoración contingente. Revista de Análisis Económico, 16(1), 3–30. https://www2.udec.cl/~rea/REVISTA%20PDF/Rev57/articulo1.pdf
dc.relation.referencesAdanikin, A. I., Wood, R., Williams, G., Harkness, M., Pell, J. P., & Smith, G. C. (2022). Association of birthweight centiles and early childhood development of singleton infants born from 37 weeks of gestation in Scotland: A population-based cohort study. PLOS Medicine, 19(10), e1004108. https://doi.org/10.1371/journal.pmed.1004108
dc.relation.referencesAgresti, A. (2002). Categorical data analysis (2nd ed.). John Wiley & Sons.
dc.relation.referencesAlejo, Y. Z. V. (2020). Factores asociados al bajo peso al nacer a término, Colombia, 2019. Reporte Epidemiológico Nacional, 1(3), 10.
dc.relation.referencesÁlvarez, R., Urra, L., & Aliño, M. (2018). Informe de evento bajo peso al nacer a término, Colombia, 2018. Instituto Nacional de Salud.
dc.relation.referencesAquino Grande, D. J. (2022). Factores asociados a neonatos peruanos con bajo peso al nacer por regiones naturales según ENDES 2019. (Tesis de licenciatura, Universidad Peruana Cayetano Heredia).
dc.relation.referencesBarrios, J. (2019). La matriz de confusión y sus métricas. [Consultado el 22 de junio de 2025]. https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/
dc.relation.referencesBarros, A. J., & Hirakata, V. N. (2003). Alternatives for logistic regression in cross-sectional studies: An empirical comparison of models that directly estimate the prevalence ratio. BMC Medical Research Methodology, 3(1), 21. https://doi.org/10.1186/1471-2288-3-21
dc.relation.referencesBrufman, J. Z., Urbisaia, H. L., & Trajtenberg, L. A. (2008). Distribución del ingreso según género: Un enfoque semiparamétrico. Cuadernos del CIMBAGE, (10), 47–74.
dc.relation.referencesChawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321–357.
dc.relation.referencesDel Pilar Vélez-Gómez, M., Barros, F. C., Echavarría-Restrepo, L. G., & Hormaza-Angel, M. P. (2006). Prevalencia de bajo peso al nacer y factores maternos asociados: Unidad de Atención y Protección Materno Infantil de la Clínica Universitaria Bolivariana, Medellín, Colombia. Revista Colombiana de Obstetricia y Ginecología, 57(4), 264–270.
dc.relation.referencesDobson, A. J., & Barnett, A. G. (2018). An introduction to generalized linear models (4th ed.). Chapman & Hall/CRC.
dc.relation.referencesFawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861–874.
dc.relation.referencesFranco Monsreal, J., Tun Cobos, M. d. R., Hernández Gómez, J. R., & Serralta Peraza, L. E. d. S. (2018). Factores de riesgo de bajo peso al nacer según el modelo de regresión logística múltiple: Estudio de cohorte retrospectiva en el municipio José María Morelos, Quintana Roo, México. Medwave, 18(01)
dc.relation.referencesFriedman, J., Hastie, T., & Tibshirani, R. (2024). glmnet: Lasso and Elastic-Net Regularized Generalized Linear Models (versión 4.1-8) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/glmnet/glmnet.pdf
dc.relation.referencesFriedman, J. H., Hastie, T., & Tibshirani, R. (2010). Regularization paths for generalized linear models via coordinate descent. Journal of Statistical Software, 33, 1–22.
dc.relation.referencesGarcía Abad, J., et al. (2021). Comparativa de técnicas de balanceo de datos. Aplicación a un caso real para la predicción de fuga de clientes [Tesis de maestría].
dc.relation.referencesGiolo, S. R. (2021). Introdução à análise de dados categóricos com aplicações. Editora Blucher.
dc.relation.referencesGómez Mendoza, C., Ruiz Álvarez, P., Garrido Bosze, I., & Rodríguez Calvo, M. D. (2018). Bajo peso al nacer, una problemática actual. Revista Archivo Médico de Camagüey, 22(4), 408–416.
dc.relation.referencesHanley, J. A., & McNeil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology, 143(1), 29–36.
dc.relation.referencesHurtado Ibarra, K., Rodríguez Cuadro, D., Navarro Manotas, E., Camacho Castro, C., & Nieves Vanegas, S. (2015). Análisis de los factores de riesgo de bajo peso al nacer a partir de un modelo logístico polinómico. Prospectiva, 13(1), 76–85.
dc.relation.referencesJames, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). Springer. https://www.statlearning.com/
dc.relation.referencesLumumba, V. W., Kiprotich, D., Makena, N., Kavita, M., & Mpaine, M. (2024). Comparative analysis of cross-validation techniques: LOOCV, K-folds cross-validation, and repeated K-folds cross-validation in machine learning models. American Journal of Theoretical and Applied Statistics, 13, 127–137.
dc.relation.referencesMárquez-Beltrán, M. F., Vargas-Hernández, J. E., Quiroga-Villalobos, E. F., & Pinzón Villate, G. Y. (2013). Análisis del bajo peso al nacer en Colombia 2005–2009. Revista de Salud Pública, 15, 626–637.
dc.relation.referencesMeneses, S., Buitrago, S., & Ortega-Ávila, J. G. (2023). Percentiles antropométricos de recién nacidos prematuros con bajo peso al nacer y muy bajo peso al nacer, participantes de un programa madre canguro en Santiago de Cali, Colombia. Salutem Scientia Spiritus, 9(1), 16–27.
dc.relation.referencesMinisterio de Salud y Protección Social de Colombia. (s.f.). Guía de Atención del Bajo Peso al Nacer. Ministerio de Salud, Dirección General de Promoción y Prevención. https://platform.who.int/docs/default-source/mca-documents/policy-documents/guideline/COL-2001-Guideline-LBW-ES.pdf
dc.relation.referencesMontgomery, D. C. (2002). Introducción al análisis de regresión lineal. México, DF: Compañía Editorial Continental.
dc.relation.referencesOrganización Mundial de la Salud (OMS). (2017). Metas mundiales de nutrición 2025: Documento normativo sobre bajo peso al nacer.
dc.relation.referencesPlanchez, L. C., Johson, L. F. R., & de Pedro, N. M. (2021). Diseño y aplicación de un índice pronóstico de bajo peso al nacer. Revista Cubana de Obstetricia y Ginecología, 47(2), e653. https://www.revsecvi.org/index.php/revista/issue/view/1
dc.relation.referencesPowers, D. M. W. (2020). Evaluation: From precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies, 2(1), 37–63.
dc.relation.referencesPregibon, D. (1981). Logistic regression diagnostics. The Annals of Statistics, 9(4), 705–724.
dc.relation.referencesRamírez Rojas, K. (2018). Estudio del bajo peso de los niños mediante el modelo aditivo generalizado para ubicación, escala y forma en Ibagué año 2014. (Tesis de maestría).
dc.relation.referencesRobinson, P. M. (1988). Root-N-consistent semiparametric regression. Econometrica: Journal of the Econometric Society, 56(4), 931–954.
dc.relation.referencesSaavedra, S. G. (2017). Modelos de regresión logística aplicados al estudio de transmisión genética [Tesis de maestría, Universidad Nacional Autónoma de México].
dc.relation.referencesStüsser, R., Paz, G., Ortega, M., Pineda, S., Infante, O., Martín, P., & Ordoñez, C. (1993). Riesgo de bajo peso al nacer en el área Plaza de la Habana. Boletín de la Oficina Sanitaria Panamericana (OSP), 114(3), 199–206.
dc.relation.referencesTalaigua-Feria, D. P., & Camilo, T. R. J. (2024). Determinantes sociales de la salud asociados al bajo peso al nacer en el departamento de La Guajira en el año 2021. Revista Investigaciones Andina, 26(48).
dc.relation.referencesTherneau, T. M., & Atkinson, B. (2024). rpart: Recursive Partitioning and Regression Trees (versión 4.1-23) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/rpart/rpart.pdf
dc.relation.referencesVelázquez Quintana, N. I., Masud Yunes Zárraga, J. L., & Ávila Reyes, R. (2004). Recién nacidos con bajo peso: causas, problemas y perspectivas a futuro. Boletín Médico del Hospital Infantil de México, 61(1), 73–86.
dc.relation.referencesVictora, C. G., Adair, L., Fall, C., Hallal, P. C., Martorell, R., Richter, L., & Sachdev, H. S. (2008). Maternal and child undernutrition: Consequences for adult health and human capital. The Lancet, 371(9609), 340–357. https://doi.org/10.1016/S0140-6736(07)61692-4
dc.relation.referencesWood, S. N. (2024). mgcv: Mixed GAM Computation Vehicle with Automatic Smoothness Estimation (versión 1.9-1) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/mgcv/mgcv.pdf
dc.rightsCopyright Universidad de Córdoba, 2025
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.keywordsSMOTE
dc.subject.proposalOversampling
dc.subject.proposalBajo peso al nacer
dc.titleAplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacer
dc.typeTrabajo de grado - Pregrado
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication
Archivos
Bloque original
Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
MartínezLópezAntonioJosé.pdf
Tamaño:
3.48 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
Formato de autorización.pdf
Tamaño:
346.8 KB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
15.18 KB
Formato:
Item-specific license agreed upon to submission
Descripción: