Publicación: Aplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacer
dc.contributor.advisor | Morales Ospina, Víctor Hugo | |
dc.contributor.advisor | Romero Osorio, Fray | |
dc.contributor.author | Martínez López, Antonio José | |
dc.contributor.jury | Morales Rivera, Mario Alfonso | |
dc.contributor.jury | Herrera Guerra, Eugenia del Pilar | |
dc.date.accessioned | 2025-06-27T20:13:12Z | |
dc.date.available | 2025-06-27T20:13:12Z | |
dc.date.issued | 2025-06-27 | |
dc.description.abstract | El bajo peso al nacer, definido por la OMS como menos de 2.500 gramos, incrementa el riesgo de complicaciones y mortalidad en recién nacidos. Este trabajo analizó factores de riesgo asociados al bajo peso al nacer en Medellín aplicando modelos de regresión logística clásica, penalizada y GAM, enfrentando el desbalance de datos mediante técnicas de oversampling como SMOTE. El uso de estas técnicas permitió mejorar la detección de casos críticos, logrando modelos más sensibles y precisos. Se identificó que comunas como Manrique, Popular y Robledo concentran la mayor incidencia, y que la talla al nacer y las semanas de gestación son factores clave asociados al riesgo. El estudio evidencia que, ante datos clínicos reales y complejos, el uso de métodos modernos combinados con enfoques clásicos aporta resultados más robustos para la salud pública. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Estadístico(a) | |
dc.description.modality | Trabajos de Investigación y/o Extensión | |
dc.description.notes | Este documento analiza factores de riesgo asociados al bajo peso al nacer en Medellín, empleando modelos de regresión logística, técnicas de oversampling (SMOTE) y modelos semiparamétricos (GAM). Se identifican comunas con mayor incidencia y se destacan la talla y las semanas de gestación como factores clave. El oversampling mejoró la sensibilidad de los modelos frente al desbalance de datos. | |
dc.description.tableofcontents | 1. Introducción | |
dc.description.tableofcontents | 2. Estado del arte | |
dc.description.tableofcontents | 3. Marco teórico | |
dc.description.tableofcontents | 3.1. Determinantes sociales y clínicos del bajo peso al nacer | |
dc.description.tableofcontents | 3.2. Regresión Logística | |
dc.description.tableofcontents | 3.3. Definición del Modelo | |
dc.description.tableofcontents | 3.4. Estimación de parámetros de un modelo de regresión logística | |
dc.description.tableofcontents | 3.4.1. Estimadores de máxima verosimilitud | |
dc.description.tableofcontents | 3.5. Significancia de los efectos de las variables | |
dc.description.tableofcontents | 3.6. Diagnóstico del modelo | |
dc.description.tableofcontents | 3.7. Modelos Semiparamétricos | |
dc.description.tableofcontents | 3.7.1. Estimación y Propiedades | |
dc.description.tableofcontents | 3.8. Regresión Penalizada | |
dc.description.tableofcontents | 3.9. Oversampling y el método SMOTE | |
dc.description.tableofcontents | 3.10. Aprendizaje automático (Machine Learning, ML) | |
dc.description.tableofcontents | 3.10.1. Matriz de Confusión | |
dc.description.tableofcontents | 3.10.2. Métricas de Evaluación | |
dc.description.tableofcontents | 4. Metodología | |
dc.description.tableofcontents | 4.1. Tipo y diseño de investigación | |
dc.description.tableofcontents | 4.2. Población | |
dc.description.tableofcontents | 4.3. Tipo de Muestreo | |
dc.description.tableofcontents | 4.4. Variables | |
dc.description.tableofcontents | 5. Resultados y discusión | |
dc.description.tableofcontents | 5.1. Tipo de seguridad social | |
dc.description.tableofcontents | 5.2. Nivel educativo de la madre | |
dc.description.tableofcontents | 5.3. Semanas de gestación | |
dc.description.tableofcontents | 5.4. Edad materna | |
dc.description.tableofcontents | 5.4. Edad materna | |
dc.description.tableofcontents | 5.5. Tendencia anual de nacimientos registrados | |
dc.description.tableofcontents | 5.6. Distribución por sexo y justificación de la muestra analizada | |
dc.description.tableofcontents | 5.7. Mapas de calor elaborados a partir de la incidencia del bajo peso al nacer | |
dc.description.tableofcontents | 5.8. Regresión logística | |
dc.description.tableofcontents | 5.9. Modelo semiparamétrico aditivo generalizado (GAM) | |
dc.description.tableofcontents | 5.10. Métricas de desempeño de los diferentes modelos de clasificación | |
dc.description.tableofcontents | 5.10.1. Comparación de la capacidad discriminativa (AUC) entre modelos | |
dc.description.tableofcontents | 5.11. Regresión logística clásica | |
dc.description.tableofcontents | 5.12. Regresión logística penalizada (Ridge) | |
dc.description.tableofcontents | 5.13. Árbol de decisión (CART) | |
dc.description.tableofcontents | 6. Conclusiones | |
dc.description.tableofcontents | 7. Referencias | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad de Córdoba | |
dc.identifier.reponame | Repositorio Universidad de Córdoba | |
dc.identifier.repourl | https://repositorio.unicordoba.edu.co/ | |
dc.identifier.uri | https://repositorio.unicordoba.edu.co/handle/ucordoba/9222 | |
dc.language.iso | spa | |
dc.publisher | Universidad de Córdoba | |
dc.publisher.faculty | Facultad de Ciencias Básicas | |
dc.publisher.place | Montería, Córdoba, Colombia | |
dc.publisher.program | Estadística | |
dc.relation.references | Abarca, R. E. (2001). Estimaciones paramétricas, semiparamétricas y no paramétricas en valoración contingente. Revista de Análisis Económico, 16(1), 3–30. https://www2.udec.cl/~rea/REVISTA%20PDF/Rev57/articulo1.pdf | |
dc.relation.references | Adanikin, A. I., Wood, R., Williams, G., Harkness, M., Pell, J. P., & Smith, G. C. (2022). Association of birthweight centiles and early childhood development of singleton infants born from 37 weeks of gestation in Scotland: A population-based cohort study. PLOS Medicine, 19(10), e1004108. https://doi.org/10.1371/journal.pmed.1004108 | |
dc.relation.references | Agresti, A. (2002). Categorical data analysis (2nd ed.). John Wiley & Sons. | |
dc.relation.references | Alejo, Y. Z. V. (2020). Factores asociados al bajo peso al nacer a término, Colombia, 2019. Reporte Epidemiológico Nacional, 1(3), 10. | |
dc.relation.references | Álvarez, R., Urra, L., & Aliño, M. (2018). Informe de evento bajo peso al nacer a término, Colombia, 2018. Instituto Nacional de Salud. | |
dc.relation.references | Aquino Grande, D. J. (2022). Factores asociados a neonatos peruanos con bajo peso al nacer por regiones naturales según ENDES 2019. (Tesis de licenciatura, Universidad Peruana Cayetano Heredia). | |
dc.relation.references | Barrios, J. (2019). La matriz de confusión y sus métricas. [Consultado el 22 de junio de 2025]. https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/ | |
dc.relation.references | Barros, A. J., & Hirakata, V. N. (2003). Alternatives for logistic regression in cross-sectional studies: An empirical comparison of models that directly estimate the prevalence ratio. BMC Medical Research Methodology, 3(1), 21. https://doi.org/10.1186/1471-2288-3-21 | |
dc.relation.references | Brufman, J. Z., Urbisaia, H. L., & Trajtenberg, L. A. (2008). Distribución del ingreso según género: Un enfoque semiparamétrico. Cuadernos del CIMBAGE, (10), 47–74. | |
dc.relation.references | Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16, 321–357. | |
dc.relation.references | Del Pilar Vélez-Gómez, M., Barros, F. C., Echavarría-Restrepo, L. G., & Hormaza-Angel, M. P. (2006). Prevalencia de bajo peso al nacer y factores maternos asociados: Unidad de Atención y Protección Materno Infantil de la Clínica Universitaria Bolivariana, Medellín, Colombia. Revista Colombiana de Obstetricia y Ginecología, 57(4), 264–270. | |
dc.relation.references | Dobson, A. J., & Barnett, A. G. (2018). An introduction to generalized linear models (4th ed.). Chapman & Hall/CRC. | |
dc.relation.references | Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861–874. | |
dc.relation.references | Franco Monsreal, J., Tun Cobos, M. d. R., Hernández Gómez, J. R., & Serralta Peraza, L. E. d. S. (2018). Factores de riesgo de bajo peso al nacer según el modelo de regresión logística múltiple: Estudio de cohorte retrospectiva en el municipio José María Morelos, Quintana Roo, México. Medwave, 18(01) | |
dc.relation.references | Friedman, J., Hastie, T., & Tibshirani, R. (2024). glmnet: Lasso and Elastic-Net Regularized Generalized Linear Models (versión 4.1-8) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/glmnet/glmnet.pdf | |
dc.relation.references | Friedman, J. H., Hastie, T., & Tibshirani, R. (2010). Regularization paths for generalized linear models via coordinate descent. Journal of Statistical Software, 33, 1–22. | |
dc.relation.references | García Abad, J., et al. (2021). Comparativa de técnicas de balanceo de datos. Aplicación a un caso real para la predicción de fuga de clientes [Tesis de maestría]. | |
dc.relation.references | Giolo, S. R. (2021). Introdução à análise de dados categóricos com aplicações. Editora Blucher. | |
dc.relation.references | Gómez Mendoza, C., Ruiz Álvarez, P., Garrido Bosze, I., & Rodríguez Calvo, M. D. (2018). Bajo peso al nacer, una problemática actual. Revista Archivo Médico de Camagüey, 22(4), 408–416. | |
dc.relation.references | Hanley, J. A., & McNeil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology, 143(1), 29–36. | |
dc.relation.references | Hurtado Ibarra, K., Rodríguez Cuadro, D., Navarro Manotas, E., Camacho Castro, C., & Nieves Vanegas, S. (2015). Análisis de los factores de riesgo de bajo peso al nacer a partir de un modelo logístico polinómico. Prospectiva, 13(1), 76–85. | |
dc.relation.references | James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). Springer. https://www.statlearning.com/ | |
dc.relation.references | Lumumba, V. W., Kiprotich, D., Makena, N., Kavita, M., & Mpaine, M. (2024). Comparative analysis of cross-validation techniques: LOOCV, K-folds cross-validation, and repeated K-folds cross-validation in machine learning models. American Journal of Theoretical and Applied Statistics, 13, 127–137. | |
dc.relation.references | Márquez-Beltrán, M. F., Vargas-Hernández, J. E., Quiroga-Villalobos, E. F., & Pinzón Villate, G. Y. (2013). Análisis del bajo peso al nacer en Colombia 2005–2009. Revista de Salud Pública, 15, 626–637. | |
dc.relation.references | Meneses, S., Buitrago, S., & Ortega-Ávila, J. G. (2023). Percentiles antropométricos de recién nacidos prematuros con bajo peso al nacer y muy bajo peso al nacer, participantes de un programa madre canguro en Santiago de Cali, Colombia. Salutem Scientia Spiritus, 9(1), 16–27. | |
dc.relation.references | Ministerio de Salud y Protección Social de Colombia. (s.f.). Guía de Atención del Bajo Peso al Nacer. Ministerio de Salud, Dirección General de Promoción y Prevención. https://platform.who.int/docs/default-source/mca-documents/policy-documents/guideline/COL-2001-Guideline-LBW-ES.pdf | |
dc.relation.references | Montgomery, D. C. (2002). Introducción al análisis de regresión lineal. México, DF: Compañía Editorial Continental. | |
dc.relation.references | Organización Mundial de la Salud (OMS). (2017). Metas mundiales de nutrición 2025: Documento normativo sobre bajo peso al nacer. | |
dc.relation.references | Planchez, L. C., Johson, L. F. R., & de Pedro, N. M. (2021). Diseño y aplicación de un índice pronóstico de bajo peso al nacer. Revista Cubana de Obstetricia y Ginecología, 47(2), e653. https://www.revsecvi.org/index.php/revista/issue/view/1 | |
dc.relation.references | Powers, D. M. W. (2020). Evaluation: From precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies, 2(1), 37–63. | |
dc.relation.references | Pregibon, D. (1981). Logistic regression diagnostics. The Annals of Statistics, 9(4), 705–724. | |
dc.relation.references | Ramírez Rojas, K. (2018). Estudio del bajo peso de los niños mediante el modelo aditivo generalizado para ubicación, escala y forma en Ibagué año 2014. (Tesis de maestría). | |
dc.relation.references | Robinson, P. M. (1988). Root-N-consistent semiparametric regression. Econometrica: Journal of the Econometric Society, 56(4), 931–954. | |
dc.relation.references | Saavedra, S. G. (2017). Modelos de regresión logística aplicados al estudio de transmisión genética [Tesis de maestría, Universidad Nacional Autónoma de México]. | |
dc.relation.references | Stüsser, R., Paz, G., Ortega, M., Pineda, S., Infante, O., Martín, P., & Ordoñez, C. (1993). Riesgo de bajo peso al nacer en el área Plaza de la Habana. Boletín de la Oficina Sanitaria Panamericana (OSP), 114(3), 199–206. | |
dc.relation.references | Talaigua-Feria, D. P., & Camilo, T. R. J. (2024). Determinantes sociales de la salud asociados al bajo peso al nacer en el departamento de La Guajira en el año 2021. Revista Investigaciones Andina, 26(48). | |
dc.relation.references | Therneau, T. M., & Atkinson, B. (2024). rpart: Recursive Partitioning and Regression Trees (versión 4.1-23) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/rpart/rpart.pdf | |
dc.relation.references | Velázquez Quintana, N. I., Masud Yunes Zárraga, J. L., & Ávila Reyes, R. (2004). Recién nacidos con bajo peso: causas, problemas y perspectivas a futuro. Boletín Médico del Hospital Infantil de México, 61(1), 73–86. | |
dc.relation.references | Victora, C. G., Adair, L., Fall, C., Hallal, P. C., Martorell, R., Richter, L., & Sachdev, H. S. (2008). Maternal and child undernutrition: Consequences for adult health and human capital. The Lancet, 371(9609), 340–357. https://doi.org/10.1016/S0140-6736(07)61692-4 | |
dc.relation.references | Wood, S. N. (2024). mgcv: Mixed GAM Computation Vehicle with Automatic Smoothness Estimation (versión 1.9-1) [Paquete R]. CRAN. https://cran.r-project.org/web/packages/mgcv/mgcv.pdf | |
dc.rights | Copyright Universidad de Córdoba, 2025 | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.keywords | SMOTE | |
dc.subject.proposal | Oversampling | |
dc.subject.proposal | Bajo peso al nacer | |
dc.title | Aplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacer | |
dc.type | Trabajo de grado - Pregrado | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
dc.type.content | Text | |
dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
dc.type.version | info:eu-repo/semantics/acceptedVersion | |
dspace.entity.type | Publication |
Archivos
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 15.18 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: