B.F.A. Trabajos de Investigación y/o Extensión
URI permanente para esta colección
Navegar
Envíos recientes
Publicación Embargo Estudio ampliado de una carta EWMA con varianza efectiva para monitorear la variabilidad en procesos multivariados(Universidad de Córdoba, 2025-06-30) Cuadrado Paternina, Richard David; Morales Ospins, Victor Hugo; Morales Rivera, Mario AlfonsoEl control de cambios sutiles en la variabilidad de un proceso con tres variables es un reto en el control estadístico de calidad. Las cartas EWMA han demostrado ser eficaces en este contexto, generalmente basándose en la varianza generalizada, definida como el determinante de la matriz de covarianzas. Peña y Rodríguez (2003) propusieron la varian za efectiva, definida como la raíz p-ésima de la varianza generalizada, ofreciendo ventajas en ciertos escenarios multivariados. La mayoría de las cartas de control han sido diseña das para procesos univariados, con menor desarrollo en el monitoreo de la variabilidad multivariada. La carta basada en la varianza generalizada es la más utilizada, pero, al ser tipo Shewhart, tiene limitaciones en la detección de pequeños cambios en la matriz de covarianzas. En este estudio, se amplía la carta EWMA basada en la varianza efectiva, extendiendo la propuesta de Morales y Vargas (2008) más allá de p = 2 y considerando más escenarios de simulación. Se compara su desempeño con la carta de la varianza generalizada usando la longitud de corrida promedio (ARL) para determinar cuál es más efectiva en la detección de cambios en la variabilidad de procesos multivariados. Además, se presenta una breve aplicación comparativa de ambas cartas en un caso simulado y uno real, ilustrando su comportamiento en distintos contextos.Publicación Embargo Comparación de estimadores no paramétricos de la función de sobrevivencia usando ECM: un estudio de simulación(Universidad de Córdoba, 2025-06-26) Velásquez Roy, María Paola; Ramirez Montoya, Javier; Tovar Falon, Roger de Jesús; Ángel Guzmán, Jairo ArturoEn el análisis de sobrevivencia, se dispone de diversas metodologías para estimar la función de sobrevivencia, que incluyen enfoques paramétricos, semiparamétricos y no paramétricos. Esta investigación se enfoca específicamente en el análisis no paramétrico, con especial atención al estimador de Kaplan-Meier, ampliamente difundido en la literatura por su simplicidad y utilidad práctica. El propósito de este trabajo es comparar el desempeño de varios estimadores no paramétricos de la función de sobrevivencia incluyendo los de Kaplan-Meier, Nelson-Aalen, Prentice, Andersen, Harris-Albert, Moreau y Hosmer-Lemeshow a través de un diseño de simulación. Para ello, se evaluarán sus respectivos errores cuadráticos medios bajo diferentes escenarios definidos por variaciones en el tamaño muestral y el porcentaje de censura. Además, se implementará un algoritmo en R que automatice el proceso de generación de datos, estimación y comparación, incorporando la técnica de remuestreo Bootstrap con el fin de obtener distribuciones empíricas de los estimadores y cuantificar su desempeño.Publicación Acceso abierto Pronóstico de la tasa de desempleo en Colombia: aplicación del índice de base móvil en modelos clásicos de series de tiempo(Universidad de Córdoba, 2025-06-27) Coronado Teran, Jefferson; Cogollo Flórez, Myladis Rocío; ROBLES GONZALEZ, JUANA RAQUEL; Treco Hernández, ManuelEl desempleo es un fenómeno socioeconómico que impacta negativamente en el desarrollo económico de un país y en la calidad de vida de su población. En Colombia, pronosticar la tasa de desempleo se ha convertido en una necesidad por el gran porcentaje de personas sin empleo y con pocas oportunidades de mejorar su calidad de vida. Este trabajo propone un enfoque metodológico flexible para modelar series temporales con alta variabilidad y tendencia, utilizando un índice de base móvil como nueva variable de análisis. Esta variable permite evitar transformaciones y diferenciaciones adicionales en los modelos, facilitando el procesamiento y mejorando la interpretación de los datos. El estudio incluye la construcción de la variable de base móvil, el ajuste de modelos clásicos de series de tiempo. Los resultados demuestran que el uso del índice de base móvil mejora significativamente el desempeño de los modelos clásicos y ofrece resultados comparables con las redes neuronales. Se concluye que el índice de base móvil constituye una herramienta eficiente para modelar y pronosticar la tasa de desempleo, aportando ventajas como la reducción de transformaciones previas y una interpretación más sencilla de la dinámica de la serie.Publicación Acceso abierto Efecto de la censura en modelos de fragilidad Gamma(Universidad de Córdoba, 2025-06-27) Florez Florez, Lenin Jose; Ramirez Montoya, Javier; Rocha de Medeiros, Rodrigo Matheus; Martínez Flórez, Guillermo Domingo; Brango Garcia, Hugo AlbertoEn análisis de sobrevivencia el modelo de fragilidad permite capturar la heterogeneidad no observada entre los individuos, la cual no puede ser explicada por las covariables observadas. Este modelo extiende el modelo de riesgos proporcionales de Cox al incluir un término adicional (llamado “fragilidad”) que capta las diferencias no observadas en los riesgos de falla entre individuos o grupos (Janssen y Duchateau, 2011). En este trabajo se considera el modelo de fragilidad univariada en que se asume que la distribución de la fragilidad corresponde a una distribución Gamma. Este modelo es útil porque puede abordar las variaciones entre sujetos en estudios de datos agrupados. También existen modelos de fragilidad inversa Gaussiana, Gompertz, Weibull entre otros. Este modelo de fragilidad Gamma posee propiedades algebraicas convenientes además de ser muy usada en la literatura. Por otro lado, el fenómeno de censura, puede afectar la estimación de estos modelos con imprecisiones debido a mucha censura. (Klein y Moeschberger, 2003). La estimación de parámetros en los modelos de fragilidad generalmente se realiza mediante métodos de máxima verosimilitud, aunque puede ser complicada debido a la presencia de términos no observados. La predicción de fragilidades individuales se convierte en un desafío en presencia de censura, ya que no siempre se pueden observar todos los eventos de interés. En este trabajo se analizan mediante simulación las estimaciones de los parámetros de regresión del modelo de fragilidad Gamma, frente al de Cox. Calculando los errores cuadraticos medios de las estimaciones bajo diferentes escenarios de censura y tamaños de muestra.Publicación Acceso abierto Aplicación de técnicas de oversampling y modelos semiparamétricos en el análisis de factores de riesgo asociados con el bajo peso al nacer(Universidad de Córdoba, 2025-06-27) Martínez López, Antonio José; Morales Ospina, Víctor Hugo; Romero Osorio, Fray; Morales Rivera, Mario Alfonso; Herrera Guerra, Eugenia del PilarEl bajo peso al nacer, definido por la OMS como menos de 2.500 gramos, incrementa el riesgo de complicaciones y mortalidad en recién nacidos. Este trabajo analizó factores de riesgo asociados al bajo peso al nacer en Medellín aplicando modelos de regresión logística clásica, penalizada y GAM, enfrentando el desbalance de datos mediante técnicas de oversampling como SMOTE. El uso de estas técnicas permitió mejorar la detección de casos críticos, logrando modelos más sensibles y precisos. Se identificó que comunas como Manrique, Popular y Robledo concentran la mayor incidencia, y que la talla al nacer y las semanas de gestación son factores clave asociados al riesgo. El estudio evidencia que, ante datos clínicos reales y complejos, el uso de métodos modernos combinados con enfoques clásicos aporta resultados más robustos para la salud pública.Publicación Acceso abierto Metodología para la medición de la percepción en investigaciones cualitativas a partir de la construcción de un índice sintético con métodos multivariados(Universidad de Córdoba, 2025-06-26) Machado Machuca, Esneider Alfonso; Cogollo Flórez, Myladis; Morales Ospina, VictorEl estudio de la percepción, entendida como el proceso mediante el cual se organiza e interpreta la información sensorial para darle sentido al entorno, requiere de metodologías que incluyan el manejo de variables cualitativas a nivel individual y grupal (Barker,2008). Para ello se usa frecuentemente la metodología-Q, que consiste en la aplicación de un análisis factorial a la clasificación-Q de las variables cualitativas, con el fin de identificar patrones de pensamiento compartidos entre individuos (Barker, 2008). Sin embargo, esta metodología no permite cuantificar los niveles de percepción, y sus resultados son sensibles a la presencia de multicolinealidad y la interpretación subjetiva de los factores (Millar et al., 2022). En este trabajo se plantea una nueva metodología para analizar las opiniones de una persona sobre un tema. El enfoque propuesto considera la cuantificación de las categorías de las variables usando la escala Likert en términos porcentuales y la distancia entre la respuesta dada por el individuo y un valor ideal. Además, se utiliza análisis de componentes principales para agrupar las nuevas variables y construir un índice sintético global con escala 0-100. La viabilidad de la metodología propuesta es verificada usando información recolectada de 323 estudiantes de grado 9º y 10º de colegios oficiales de los municipios de Tuchín, Chinú y San Andrés de Sotavento, a los cuales se les aplicó una encuesta para examinar su percepción sobre ciencia. Los valores obtenidos por medio del índice global generalizado, mostraron que existe dispersión de este valor entre los estudiantes participantes, evidenciando casos que se pueden denotar como atípicos, ya que sus valores se encuentran muy cercanos a los valores extremos establecidos por la medida sintética. Además, las comparaciones por género muestran que existe diferencia en términos de dispersión, siendo el género femenino el que mayor variabilidad presenta. Se demuestra que la metodología propuesta es un aporte al constructo del conocimiento del análisis de datos cualitativos, porque suple las limitaciones de la metodología-Q y brinda insumos para la aplicación de otras técnicas estadísticas.Publicación Acceso abierto Estudio de la deserción estudiantil en el programa de Química de la Universidad De Córdoba usando modelos de regresión(Universidad de Córdoba, 2025-05-01) Londoño García, Pamela; Martínez Flórez, Guillermo Domingo; Tovar Falon, Roger Jesús; Treco Hernandez, Manuel AntonioLa deserción universitaria se refiere al fenómeno en el cual los estudiantes abandonan sus estudios antes de completar su programa académico, lo que tiene un impacto negativo tanto para los individuos como para las instituciones educativas. En este trabajo, se abordó la deserción estudiantil en el programa de Química de la Universidad de Córdoba, utilizando diversos modelos de clasificación y regresión para predecir la deserción. Los modelos de clasificación mostraron resultados satisfactorios, con una exactitud (accuracy) superior a 0.68, lo que demuestra su efectividad para predecir el abandono. Además, se implementó un modelo de regresión cuantílica, en el que se analizaron los cuantiles 25, 50 y 75 para evaluar qué influye en el rendimiento académico y cómo estas variables afectan la probabilidad de deserción en distintos niveles. En este modelo, se exploraron varias distribuciones para comprender mejor las variaciones en los datos, lo que permitió obtener una visión más detallada del comportamiento de los estudiantes en relación con su rendimiento académico.Publicación Embargo Bestmodel: una nueva función en R para evaluar la capacidad predictiva de un modelo(Universidad de Córdoba, 2024-12-11) Velásquez Alemán, Elkin David; Cogollo Flórez, Myladis; Morales Rivera, Mario Alfonso; Morales Ospina, VictorEl objetivo de la investigación se fundamenta en desarrollar una nueva función en R que facilite el cálculo simultáneo y rápido de las métricas para modelos de pronóstico, como series de tiempo, modelos de regresión y redes neuronales, ofreciendo una alternativa más interactiva y fácil de usar. La función fue además comparada con otras herramientas disponibles, resaltando tanto sus ventajas como sus desventajas frente a otras funciones tradicionales, que calculan métricas de manera independiente. La propuesta busca mejorar la experiencia del usuario, permitiendo la automatización de la evaluación de modelos en tan solo pocas líneas de código, optimizando el proceso de análisis, reduciendo el esfuerzo y el tiempo requerido para interpretar los resultados de manera más rápida.Publicación Acceso abierto Pronósticos del precio del ganado de primera calidad en Subastar S.A. - Montería: una comparativa entre modelos de series de tiempo clásicos, redes neuronales artificiales y modelos híbridos(Universidad de Córdoba, 2024-12-09) Miranda Urango, Yehison Elías; Pérez Cuadrado, Isaac Manuel; Treco Hernández, Manuel; Treco Hernandez, Manuel; Caicedo Castro, Isaac Bernardo; Bru Cordero, Osnamir EliasEste estudio analizó y comparó modelos de series de tiempo clásicos, redes neuronales artificiales y métodos híbridos para pronosticar el precio del ganado de primera calidad en Subastar S.A., Montería. Se destacó la importancia económica del sector ganadero en Córdoba y la evolución de la comercialización a través de subastas y plataformas virtuales. Además, se exploró el impacto de la inteligencia artificial en la predicción de precios, con énfasis en la metodología de Box-Jenkins y las redes neuronales. Se encontró que los modelos de redes neuronales híbridos CNN-LSTM y el modelo Transformer fueron los que arrojaron mejores resultados. El objetivo fue identificar el modelo más adecuado para mejorar la planificación económica y reducir riesgos financieros.Publicación Acceso abierto Análisis en fase I y fase II de una carta EWMA con límites de control dinámicos para monitorear datos basados en la distribución Birnbaum-Saunders(Universidad de Cordoba, 2024-07-10) Buelvas Pestana, Luis Miguel; Morales Ospina, Víctor; Martínez Flórez, Guillermo; Morales Rivera, Mario Alfonso; Cogollo Flórez, Miladis RocíoSpa: En el monitoreo de procesos se distinguen claramente dos fases: Fase I y Fase II. La Fase I sirve para estabilizar el proceso y estimar parámetros, principalmente, y resulta fundamental para lograr un eficiente monitoreo del proceso en Fase II, la cual se encarga del monitoreo en linea una vez cumplida la Fase I. Con frecuencia, la distribución del estadístico con el cual se hace el monitoreo del proceso, es conocida, sin embargo, en algunos casos, la distribución del estadístico de monitoreo es desconocida. Una alternativa en estos casos, es el uso de procedimientos Bootstrap, sin embargo, las cartas construidas bajo esta metodología, han mostrado algunas deficiencias en su desempeño en Fase I. En este trabajo se propone una carta de control tipo EWMA con límites dinámicos para monitorear la media de datos Birnbaum-Saunders (BS) agregados y se estudia su desempeño en Fase I y Fase II, usando como criterio sus límites de control, las desviaciones estándar de los mismos y la longitud promedio de corrida (ARL); de lo cual, se encontró que de manera general la carta propuesta funciona mucho mejor a la carta establecida para el monitoreo de un proceso que siga una distribución Birnabum-Saunders.Publicación Restringido Ajuste de modelos de Machine Learning para pronosticar el ausentismo de usuarios en una IPS(Universidad de Córdoba, 2024-07-10) Padilla Avila, Estefani Esther; Cochet Tirado, Brayan Said; Morales Rivera, Mario Alfonso; Perez Cantero, Kevin Luis; Caicedo Castro, Isaac Bernardo; Correa Vanegas, Emelis; Ruiz Sárez, Juan CamiloLa falta de asistencia a citas médicas programadas se refiere a la situación en la que los usuarios de una empresa de servicios de salud no se presentan a su cita acordada. Esta problemática puede estar influenciada por diversos factores, tales como la edad del paciente, el tipo de cita, el perfil socioeconómico, el lugar de residencia entre otros El ausentismo a las consultas médicas tiene importantes implicaciones para la entidad prestadora del servicio, tanto en términos de costos como de eficiencia. Por lo tanto, es crucial poder estimar la probabilidad de que los usuarios de una institución prestadora de salud (IPS) no se presenten a la cita previamente programada, para proponer soluciones efectivas basadas en esta información. En esta ponencia se presentarán los resultados del entrenamiento de modelos de Machine Learning (ML) para clasificar a los usuarios de la IPS según el riesgo de no asistir a una cita médica previamente programada, considerando algunas características tanto del paciente como de la cita. Además, explica una estrategia de sobre agendamiento de citas basadas en las predicciones hechas por los modelos, que brinde confianza a la IPS para administrar de manera más eficiente la programación de la agenda de los médicos, lo que a su vez contribuirá a la reducción de costos y aumento de la eficiencia de la organización. Esta aplicación de los modelos de ML proporciona una oportunidad para que la empresa optimice la asignación de citas, reduciendo el ausentismo y lo cual se vería reflejado en una atención más oportuna para los afiliados a esta entidad, con tiempos de espera más cortos al solicitar los servicios.Publicación Acceso abierto Estimación de percentiles mediante el software r-project(Universidad de Córdoba, 2024-07-10) Sánchez Medrano, Dayana; Martínez Flórez, Guillermo; Barón Cárdena, Jorge; Tovar-Falón, Roger; Morales Rivera, Mario AlfonsoLa estimación de percentiles es un procedimiento poco común, lo que hace que no se tenga mucha información sobre la aplicación para las diferentes estrategias muestrales, por lo cual, usando la estrategia de estimación de la mediana, propuesta en Sarndal et al. (1992), y algunas funciones del paquete ProbSamplingI del software R-project, se propone la programación de un código en R para llevar a cabo la estimación de percentiles e intervalos de confianzas de tales parámetros para distintos diseños muéstrales, tales como el muestreo aleatorio simple sin reposición y con reposición (MAS y MCR), muestreo sistemático, también de aquellos diseños de muestreo con probabilidades proporcionales al tamaño como el PPT y PiPT y en muestreos bietápicos. La creación de estos códigos es muy importante, ya que se obtendría de manera inmediata la estimación de estos parámetros, sin verse el usuario en la necesidad de realizar manualmente el cálculo de estas estimaciones.Publicación Restringido Análisis de la deserción estudiantil en los programas Licenciatura en Educación Física, Recreación y Deportes, y Matemáticas de la Universidad de Córdoba, desde un enfoque de género(Universidad de Córdoba, 2024-07-10) Velasquez Arteaga, Carolina; Morales Ospina, Víctor Hugo; Cogollo Flórez, Myladis; Robles González, Juana RaquelLa deserción universitaria impacta directamente a la institución, al individuo y a la sociedad en general, ya que puede afectar la economía local y nacional al reducir el número de trabajadores calificados disponibles y limitar el potencial de innovación y desarrollo económico del país o la región. Este y otros motivos generan la importancia de estudiar e investigar las razones más relevantes por las cuales un estudiante decide abandonar su proceso educativo. En este estudio se analiza la deserción estudiantil en los programas de Licenciatura en Educación Física, Recreación y Deportes, y Matemáticas de la Universidad de Córdoba, Colombia, desde un enfoque de género. El objetivo es identificar los principales factores asociados a este fenómeno desde una perspectiva de género. Se consideran dos tipos de deserción: la deserción definitiva y la deserción por programa. Para esto, se emplean modelos de regresión logística binaria con el fin de examinar las relaciones entre los diferentes tipos de deserción y variables sociodemográficas, incluyendo el sexo como factor. Entre los resultados más relevantes, se destaca que el factor sexo no mostró significancia en ninguno de los ajustes realizados. Sin embargo, en algunos casos se observó una mayor probabilidad de deserción entre las mujeres en comparación con los hombres. El promedio académico surgió como una de las variables más influyentes en este fenómeno, demostrando significancia en ambos tipos de deserción. Además, en la mayoría de los ajustes realizados para ambos tipos de deserción, las mismas variables resultaron significativas.Publicación Restringido Estimación del índice de capacidad de procesos Cpm usando un enfoque prescriptivo(Universidad de Córdoba, 2024-06-26) Jiménez Peña, Elis Loana; Cogollo Flórez, Myladis Rocío; Morales Ospina, Victor; Arteaga Sierra, MónicaLos procedimientos industriales requieren de acciones y decisiones efectivas para monitorear y mejorar la calidad de cualquier tipo de producto, manteniendo la competitividad y el cumplimiento de las especificaciones preestablecidas. Los índices de capacidad de procesos son una herramienta empleada para ello, sin embargo, generalmente requieren que se satisfaga el supuesto de normalidad de los datos del proceso, y no se ha abordado un análisis de sensibilidad del efecto que pueden tener cambios en los parámetros claves del proceso sobre el valor del índice. En este estudio se propone un análisis prescriptivo para la estimación del índice de capacidad Cpm cuando los datos del proceso no se distribuyen normalmente. Se consideran métodos de optimización tradicional y heurísticos, junto con optimización no lineal. Con la metodología propuesta se logra identificar, a partir de datos históricos, los valores óptimos de los percentiles que conllevan a obtener un valor del índice Cpm de un proceso capaz. En particular para el conjunto de datos experimental analizado, el cual se puede ajustar a una distribución Gamma, se encuentra que los valores del índice que denotan procesos capaces aumentan a medida que aumenta el parámetro de escala, mientras que el parámetro de forma se mantiene cercano a cero.Publicación Embargo Análisis comparativo del desempeño de modelos de series de tiempo tradicionales, redes neuronales artificiales y modelos híbridos para pronosticar los casos por infecciones respiratorias agudas (IRA) en la ciudad de Montería(Universidad de Córdoba, 2023-12-07) Moreno Santamaría, Iván Josué; Varilla Mendoza, Fernando Arturo; Cogollo Flórez, Myladis Rocío; Bru Cordero, Osnamir Elias; Robles González, Juana RaquelEn este trabajo investigativo, se ha llevado a cabo el modelado de los casos de IRA en la ciudad de Montería en el periodo 2012-2023 presentados por semana epidemiológica, mediante tres diferentes técnicas de pronóstico: Series de tiempo tradicionales, redes neuronales artificiales y modelos híbridos, con el objetivo de comparar sus desempeños y encontrar la metodología que mejor modela los datos. Para ello, se consideraron cinco horizontes de pronóstico: 52, 35, 17, 9 y 4 semanas epidemiológicas, donde el primer horizonte corresponde al periodo de la serie y los cuatro valores restantes corresponden a horizontes que se han sido sugeridos en la literatura para datos similares a los aquí analizados (véase por ejemplo Becerra et al. (2020), Cogollo et al. (2021)). Se encuentra que el desempeño de las tres técnicas de pronóstico consideradas en este estudio, mejora a medida que se incrementa la cantidad de datos para entrenar el modelo. Con respecto a los modelos tradicionales el más adecuado para modelar los casos de IRA es el modelo autorregresivo integrado de media móvil estacional (SARIMA) debido a la presencia de tendencia y estacionalidad. Por otra parte, se evidencia que el modelo de redes neuronales artificiales es el que presenta mejores resultados, en los distintos horizontes, en términos de la calidad del pronóstico. Adicionalmente, se demuestra que el uso de una metodología híbrida no mejora la calidad del pronóstico de los casos de IRA hallados con el modelo autorregresivo integrado de media móvil (ARIMA) y SARIMA. Se demuestra que es posible emplear los datos históricos reportados de los casos de IRA para proporcionar información estadística verídica a las entidades de salud en la ciudad de Montería, que pueda apoyar la elaboración del organigrama de prevención y control de la enfermedad.Publicación Acceso abierto Análisis de la Implementación de la Política de Bilingüismo de la Universidad de Córdoba como Estrategia de Enseñanza del Idioma Inglés(Universidad de Córdoba, 2023-11-16) Huertas Madrid, Martha Liliana; Tovar-Falón, Roger; Jerez Rodríguez, Sonia MaríaEste trabajo se enfoca en evaluar la estrategia aplicada en el Plan Institucional de Bilingüismo (PLIB) de la Universidad de Córdoba y dar a conocer una metodología estadística para medir el impacto en la Facultad de Educación y Ciencias Humanas, a través de la metodología del PLIB para reforzar el nivel de inglés de cada estudiante. El estudio se dio bajo un enfoque cuantitativo con un diseño cuasiexperimental, con un Pretest y un Post test. En una misma población donde es intervenida por la estrategia planteada en el PLIB. El análisis se llevó a cabo mediante el Software R versión 4.3.1 y Microsoft Excel licencia institucional, con el uso de pruebas de hipótesis, modelo de regresión logístico y análisis de correspondencias. Entre los resultados obtenidos en el pretest se observó que la población obtiene un bajo nivel de inglés, mientras que en el post test la población mejoró luego de su participación en el PLIB, así mismo se encontró que variables como el nivel de esfuerzo, el sexo, el tipo de institución están asociadas al nivel de inglés obtenido por el estudiante. Todo esto permitió concluir que luego ser intervenido con la estrategia del PLIB alcanzaron mejor nivel de inglés.Publicación Acceso abierto Entrenamiento de modelos de aprendizaje automático para clasificar estudiantes en posibles desertores o no desertores, en programas académicos de la Universidad de Córdoba(Universidad de Córdoba, 2023-11-10) Hoyos Vega, Jhon Jeiller; Morales Rivera, Mario Alfonso; Pérez Cantero, Kevin LuisEl objetivo de esta investigación se fundamenta en la aplicación de algoritmos de aprendizaje automático supervisado como el de regresión logística, Naive Bayes, gradient boosting y redes neuronales, para clasificar a los estudiantes de los programas de matemáticas y estadística de la Universidad de Córdoba, en el lugar de desarrollo ubicado en Montería, en posibles desertores o no desertores del programa, a partir de información de variables socioeconómicas y académicas de los estudiantes al momento de ingresar, como la edad, el puntaje ICFES en matemáticas, el promedio acumulado ponderado y otras que resultan significativas en los estudios de deserción estudiantil y que se tenían disponibles. El estudio contó con una muestra de 852 estudiantes de estos programas que presentaron matrícula académica durante las cohortes de 2015-1 hasta 2021-2, con lo cual se dispuso de un tamaño de muestra suficiente para el entrenamiento y evaluación de los modelos por medio de la aplicación de validación cruzada. Los principales hallazgos en esta investigación muestran que los cuatro algoritmos considerados alcanzan precisiones similares y por encima del 73 %, evidenciando que la información disponible es suficiente para hacer una buena clasificación de estos estudiantes, entre los que pueden optar por abandonar o no sus estudios universitarios.Publicación Acceso abierto Metodología para modelar la asociación entre dos variables aleatorias continuas a través de funciones cópula: aplicación en datos biomédicos(Universidad de Córdoba, 2023-11-02) Martinéz Hernandez, Maira Alejandra; Bru Cordero, Osnamir Elias; Martínez Flórez, Guillermo ; Brango, HugoLa estimación de la fuerza de la dependencia entre dos variables aleatorias es importante en el análisis de los datos. Un método para hallar dicha asociación son las funciones cópulas, representada como una forma paramétrica conveniente para modelar la estructura de dependencia en distribuciones conjuntas de variables aleatorias. Existe una amplia gama de funciones cópulas, por lo que la elección de una cópula adecuada es uno de los grandes retos al que se enfrenta el investigador. Con este trabajo se busca proponer un mecanismo de selección de cópula usando pruebas analíticas y gráficas, entre las pruebas gráficas se encuentran los gráficos Chi-Plot y K-Plot. Entre sus resultados relevantes se encontró que para marginales normal, la mejor cópula es gaussiana con parámetro ρ = 0.88, para marginales log-normal, la cópula que mejor ajustó fue una frank con un parámetro de 4.438, para las marginales t-student, la cópula que mejor ajustó fue una gaussiana con parámetro ρ = 0.87 y para para marginales weibull, la copula que mejor ajustó fue frank. Haciendo uso de esta metodología, fue posible encontrar la asociación de dos variables aleatorias, por medio de las funciones cópula.Publicación Acceso abierto Índices de capacidad aplicados a la prueba saber pro en los programas académicos de la facultad de Ciencias Básicas de la Universidad de Córdoba(2022-11-10) López Muñoz, Over José; Morales Ospina, Víctor HugoEn el presente trabajo, se ofrece una propuesta para cuantificar la habilidad de un proceso social para cumplir ciertos estándares, usando índices de capacidad tradicionales, los cuales son comúnmente utilizados en la industria de productos. El trabajo esta centrado en la estimación de la capacidad de los procesos al interior de los programas de la Facultad de Ciencias Básicas, para cumplir con ciertos estándares o permitir el acceso de los estudiantes a determinados beneficios, por medio de los puntajes obtenidos en las pruebas Saber Pro. Se consideraron distintos escenarios, a partir de los cuales, se derivaron distintos limites de especificación, y se determinó la capacidad del procesos en cada caso. Haciendo uso de los datos de los resultados en las pruebas Saber Pro de los programas de la Facultad de Ciencias de la Universidad de Córdoba entre los años 2016 y 2020, se ofrece una metodología detallada de la aplicación de los índices de capacidad a procesos sociales cuando los datos tienen distribución normal, con el fin de mostrar el uso de dicha metodología en la evaluación de la capacidad de este tipo de procesos.Publicación Acceso abierto Uso de los índices de capacidad fuzzy como estrategia para evaluar los resultados de la prueba saber pro de los programas de pregrado de la facultad de Ciencias Básicas de la Universidad de Córdoba(2022-06-14) Llorente Espitia, Daniel Esteban; Cogollo Flórez, Myladis Rocıo; Morales Ospina, Víctor HugoLos índices de capacidad de procesos (ICP) son una herramienta clave para comprender la capacidad de los procesos con miras a su mejoramiento, puesto que son estadísticas resumidas que miden el rendimiento real o potencial de las características del proceso en relación con el objetivo y los límites de especificación (Mohammad et al., 2011). Un ICP resume cuantitativamente el comportamiento de una característica de un producto o proceso en relación con las especificaciones. Por otra parte, otra característica que tienen los ICP tradicionales, es que tanto los límites de especificación a validar como las mediciones tomadas, corresponden a números concretos. No obstante, en la práctica hay procesos asociados a incertidumbre (Parchami et al., 2016), que conllevan al uso los números difusos, los cuales son una generalización de un número real concreto, en el sentido de que no se refiere a un único valor, sino a un conjunto conectado de valores posibles. En este trabajo, se propone y aplica una metodología basada en la fusión de la teoría del control estadístico de la calidad y la lógica difusa, para monitorear y evaluar la capacidad que tienen los programas de pregrado de la Facultad de Ciencias Básicas de la Universidad de Córdoba, para cumplir con los limites de especificación dados en el Acuerdo N◦104, donde se define el plan de estímulos a los mejores resultados Saber PRO. Así como la capacidad de superar los mejores puntajes globales promedios obtenidos por programas Nacionales afines.