Bru Cordero, Osnamir EliasMartinéz Hernandez, Maira Alejandra2023-11-022023-11-022023-11-02https://repositorio.unicordoba.edu.co/handle/ucordoba/7859La estimación de la fuerza de la dependencia entre dos variables aleatorias es importante en el análisis de los datos. Un método para hallar dicha asociación son las funciones cópulas, representada como una forma paramétrica conveniente para modelar la estructura de dependencia en distribuciones conjuntas de variables aleatorias. Existe una amplia gama de funciones cópulas, por lo que la elección de una cópula adecuada es uno de los grandes retos al que se enfrenta el investigador. Con este trabajo se busca proponer un mecanismo de selección de cópula usando pruebas analíticas y gráficas, entre las pruebas gráficas se encuentran los gráficos Chi-Plot y K-Plot. Entre sus resultados relevantes se encontró que para marginales normal, la mejor cópula es gaussiana con parámetro ρ = 0.88, para marginales log-normal, la cópula que mejor ajustó fue una frank con un parámetro de 4.438, para las marginales t-student, la cópula que mejor ajustó fue una gaussiana con parámetro ρ = 0.87 y para para marginales weibull, la copula que mejor ajustó fue frank. Haciendo uso de esta metodología, fue posible encontrar la asociación de dos variables aleatorias, por medio de las funciones cópula.Estimating the strength of the dependence between two random variables is important in data analysis. One method for finding such an association is copula functions, represented as a convenient parametric form for modeling the dependence structure in joint distributions of random variables. There is a wide range of copula functions, so the choice of a suitable copula is one of the great challenges facing the researcher. With this work we seek to propose a copula selection mechanism using analytical and graphical tests, among the graphical tests are the ChiPlot and K-Plot graphs. Among its relevant results it was found that for normal marginals, the best copula is Gaussian with parameter ρ = 0.88, for log-normal marginals, the best fitting copula was a frank with a parameter of 4.438, for t-student marginals, the best fitting copula was a Gaussian with parameter ρ = 0.87 and for weibull marginals, the best fitting copula was frank. Using this methodology, it was possible to find the association of two random variables by means of the copula functions.Resumen VIIAgradecimientos IX1. Introducción 12. Funciones cópula 42.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42.2. Familias de cópulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52.2.1. Cópulas elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62.2.1.1. Cópula gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . .62.2.1.2. Cópula t-student . . . . . . . . . . . . . . . . . . . . . . . . . .62.2.2. Cópulas arquimedianas . . . . . . . . . . . . . . . . . . . . . . . . . . . .72.2.2.1. Cópula clayton . . . . . . . . . . . . . . . . . . . . . . . . . . .72.2.2.2. Cópula gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . .82.2.2.3. Cópula frank . . . . . . . . . . . . . . . . . . . . . . . . . . . .82.2.2.4. Cópula joe . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92.2.3. Cópula de supervivencia . . . . . . . . . . . . . . . . . . . . . . . . . . .92.2.4. Cópulas de valor extremo . . . . . . . . . . . . . . . . . . . . . . . . . .112.3. τ de Kendall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112.4. Métodos gráficos de bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . .132.4.1. Método Chi-plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .132.4.2. Método K-plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .143. Modelos de validación cruzada 153.1. Criterio de información de Akaike (AIC) . . . . . . . . . . . . . . . . . . . . . .173.2. Criterio de información bayesiano de Schwarz (BIC) . . . . . . . . . . . . . . . .174. Esquemas de simulación y aplicación 184.1. Modelo con marginales weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . .224.2. Métodos gráficos para detectar dependencia . . . . . . . . . . . . . . . . . . . .244.3. Aplicación de validación cruzada para selección de modelos cópulas . . . . . . .274.4. Aplicación en datos biomédicos . . . . . . . . . . . . . . . . . . . . . . . . . . .295. Conclusiones y recomendaciones 345.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .345.2. Recomendaciones y futuras investigaciones . . . . . . . . . . . . . . . . . . . . .35A. Código en R para el proceso de simulación 36B. Marginales normal 39C. Marginales log-normal 56D. Marginales t-student 73E. Marginales weibull 90F. Simulación para datos biomédicos 107Lista de Tablas2.1. Propiedades de familias de cópulas elíticas bivariadas . . . . . . . . . . . . . . .122.2. Propiedades de familias de cópulas arquimedianas bivariadas . . . . . . . . . . .124.1. Nombres de cópulas bivariadas . . . . . . . . . . . . . . . . . . . . . . . . . . . .194.2. Resumen de simulación para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .204.3. Resumen de simulación para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .214.4. Resumen de simulación para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.5. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .224.6. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .234.7. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .234.8. AIC y BIC para cópulas ajustadas para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .274.9. AIC y BIC para cópulas ajustadas para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .274.10. AIC y BIC para cópulas ajustadas para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .284.11. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .284.12. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .284.13. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .294.14. Resumen de simulación para datos biomedicos . . . . . . . . . . . . . . . . . . .324.15. AIC y BIC para cópulas ajustadas para datos biomédicos . . . . . . . . . . . . .33B.1. Pares de variables aleatorias marginales normal n = 50, r = 20 . . . . . . . . . .39B.2. Pares de variables aleatorias marginales normal n = 50, r = 40 . . . . . . . . . .40B.3. Pares de variables aleatorias marginales normal n = 50, r = 100 . . . . . . . . .41B.4. Pares de variables aleatorias marginales normal n = 100, r = 20 . . . . . . . . .44B.5. Pares de variables aleatorias marginales normal n = 100, r = 40 . . . . . . . . .45B.6. Pares de variables aleatorias marginales normal n = 100, r = 100 . . . . . . . . .46B.7. Pares de variables aleatorias marginales normal n = 500, r = 20 . . . . . . . . .50B.8. Pares de variables aleatorias marginales normal n = 500, r = 40 . . . . . . . . .51B.9. Pares de variables aleatorias marginales normal n = 500, r = 100 . . . . . . . . .52C.1. Pares de variables aleatorias marginales log-normal n = 50, r = 20 . . . . . . . .56C.2. Pares de variables aleatorias marginales log-normal n = 50, r = 40 . . . . . . . .57C.3. Pares de variables aleatorias marginales log-normal n = 50, r = 100 . . . . . . .58C.4. Pares de variables aleatorias marginales log-normal n = 100, r = 20 . . . . . . .61C.5. Pares de variables aleatorias marginales log-normal n = 100, r = 40 . . . . . . .62C.6. Pares de variables aleatorias marginales log-normal n = 100, r = 100 . . . . . . .64C.7. Pares de variables aleatorias marginales log-normal n = 500, r = 20 . . . . . . .67C.8. Pares de variables aleatorias marginales log-normal n = 500, r = 40 . . . . . . .68C.9. Pares de variables aleatorias marginales log-normal n = 500, r = 100 . . . . . . .69D.1. Pares de variables aleatorias marginales t-student n = 50, r = 20 . . . . . . . . .73D.2. Pares de variables aleatorias marginales t-studen n = 50, r = 40 . . . . . . . . .74D.3. Pares de variables aleatorias marginales t-studen n = 50, r = 100 . . . . . . . .75D.4. Pares de variables aleatorias marginales t-studen n = 100, r = 20 . . . . . . . .78D.5. Pares de variables aleatorias marginales t-studen n = 100, r = 40 . . . . . . . .79D.6. Pares de variables aleatorias marginales t-studen n = 100, r = 100 . . . . . . . .81D.7. Pares de variables aleatorias marginales t-studen n = 500, r = 20 . . . . . . . .84D.8. Pares de variables aleatorias marginales t-studen n = 500, r = 40 . . . . . . . .85D.9. Pares de variables aleatorias marginales t-studen n = 500, r = 100 . . . . . . . .86E.1. Pares de variables aleatorias marginales weibull n = 50, r = 20 . . . . . . . . . .90E.2. Pares de variables aleatorias marginales weibull n = 50, r = 40 . . . . . . . . . .91E.3. Pares de variables aleatorias marginales weibull n = 50, r = 100 . . . . . . . . .92E.4. Pares de variables aleatorias marginales weibull n = 100, r = 20 . . . . . . . . .95E.5. Pares de variables aleatorias marginales weibull n = 100, r = 40 . . . . . . . . .96E.6. Pares de variables aleatorias marginales weibull n = 100, r = 100 . . . . . . . . .98E.7. Pares de variables aleatorias marginales weibull n = 500, r = 20 . . . . . . . . .101E.8. Pares de variables aleatorias marginales weibull n = 500, r = 40 . . . . . . . . .102E.9. Pares de variables aleatorias marginales weibull n = 500, r = 100 . . . . . . . . .103F.1. aplicación datos bimédicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107Lista de Figuras4.1. Métodos gráficos para la cópula gaussina con ρ = 0.88, para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .244.2. Métodos gráficos para la cópula frank con θ = 4.438, para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .244.3. Métodos gráficos para la cópula gaussina con ρ = 0.87, para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .254.4. Métodos gráficos para la cópula frank con θ = 4.0136, para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .254.5. Métodos gráficos para la cópula frank con θ = 3.3525, para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .264.6. Métodos gráficos para la cópula survival BB7 con θ1 = 1.61 y θ2 = 4.48, para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . .264.7. Gráfico de dispersión entre tiempo oficio y micronúcleo . . . . . . . . . . . . . . . . . . .304.8. Histograma y densidad para tiempo oficio . . . . . . . . . . . . . . . . . . . . . . . . .314.9. Histograma y densidad para micronúcleo . . . . . . . . . . . . . . . . . . . . . . . . .314.10. Métodos gráficos para la cópula joe rotada 90 grados para datos biomédicos . . . . . . . . .32spaCopyright Universidad de Córdoba, 2023500 - Ciencias naturales y matemáticasMetodología para modelar la asociación entre dos variables aleatorias continuas a través de funciones cópula: aplicación en datos biomédicosTrabajo de grado - PregradoAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)info:eu-repo/semantics/openAccessFunción cópulaDependenciaDatos bivariadosτ de kendallMétodos gráficosCopula functionDependenceBivariate dataKendall’s τGraphical methodsUniversidad de CórdobaRepositorio Universidad de Córdobahttps://repositorio.unicordoba.edu.co/http://purl.org/coar/access_right/c_abf2