Morales Ospina, Víctor HugoRomero Osorio, FrayMartínez López, Antonio José2025-06-272025-06-272025-06-27https://repositorio.unicordoba.edu.co/handle/ucordoba/9222El bajo peso al nacer, definido por la OMS como menos de 2.500 gramos, incrementa el riesgo de complicaciones y mortalidad en recién nacidos. Este trabajo analizó factores de riesgo asociados al bajo peso al nacer en Medellín aplicando modelos de regresión logística clásica, penalizada y GAM, enfrentando el desbalance de datos mediante técnicas de oversampling como SMOTE. El uso de estas técnicas permitió mejorar la detección de casos críticos, logrando modelos más sensibles y precisos. Se identificó que comunas como Manrique, Popular y Robledo concentran la mayor incidencia, y que la talla al nacer y las semanas de gestación son factores clave asociados al riesgo. El estudio evidencia que, ante datos clínicos reales y complejos, el uso de métodos modernos combinados con enfoques clásicos aporta resultados más robustos para la salud pública.1. Introducción2. Estado del arte3. Marco teórico3.1. Determinantes sociales y clínicos del bajo peso al nacer3.2. Regresión Logística3.3. Definición del Modelo3.4. Estimación de parámetros de un modelo de regresión logística3.4.1. Estimadores de máxima verosimilitud3.5. Significancia de los efectos de las variables3.6. Diagnóstico del modelo3.7. Modelos Semiparamétricos3.7.1. Estimación y Propiedades3.8. Regresión Penalizada3.9. Oversampling y el método SMOTE3.10. Aprendizaje automático (Machine Learning, ML)3.10.1. Matriz de Confusión3.10.2. Métricas de Evaluación4. Metodología4.1. Tipo y diseño de investigación4.2. Población4.3. Tipo de Muestreo4.4. Variables5. Resultados y discusión5.1. Tipo de seguridad social5.2. Nivel educativo de la madre5.3. Semanas de gestación5.4. Edad materna5.4. Edad materna5.5. Tendencia anual de nacimientos registrados5.6. Distribución por sexo y justificación de la muestra analizada5.7. Mapas de calor elaborados a partir de la incidencia del bajo peso al nacer5.8. Regresión logística5.9. Modelo semiparamétrico aditivo generalizado (GAM)5.10. Métricas de desempeño de los diferentes modelos de clasificación5.10.1. Comparación de la capacidad discriminativa (AUC) entre modelos5.11. Regresión logística clásica5.12. Regresión logística penalizada (Ridge)5.13. Árbol de decisión (CART)6. Conclusiones7. Referenciasapplication/pdfspaCopyright Universidad de Córdoba, 2025Aplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacerTrabajo de grado - PregradoAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)info:eu-repo/semantics/openAccessOversamplingBajo peso al nacerSMOTEUniversidad de CórdobaRepositorio Universidad de Córdobahttps://repositorio.unicordoba.edu.co/http://purl.org/coar/access_right/c_abf2