Publicación:
Metodología para modelar la asociación entre dos variables aleatorias continuas a través de funciones cópula: aplicación en datos biomédicos

dc.contributor.advisorBru Cordero, Osnamir Elias
dc.contributor.authorMartinéz Hernandez, Maira Alejandra
dc.contributor.juryMartínez Flórez, Guillermo
dc.contributor.juryBrango, Hugo
dc.date.accessioned2023-11-02T19:48:00Z
dc.date.available2023-11-02T19:48:00Z
dc.date.issued2023-11-02
dc.description.abstractLa estimación de la fuerza de la dependencia entre dos variables aleatorias es importante en el análisis de los datos. Un método para hallar dicha asociación son las funciones cópulas, representada como una forma paramétrica conveniente para modelar la estructura de dependencia en distribuciones conjuntas de variables aleatorias. Existe una amplia gama de funciones cópulas, por lo que la elección de una cópula adecuada es uno de los grandes retos al que se enfrenta el investigador. Con este trabajo se busca proponer un mecanismo de selección de cópula usando pruebas analíticas y gráficas, entre las pruebas gráficas se encuentran los gráficos Chi-Plot y K-Plot. Entre sus resultados relevantes se encontró que para marginales normal, la mejor cópula es gaussiana con parámetro ρ = 0.88, para marginales log-normal, la cópula que mejor ajustó fue una frank con un parámetro de 4.438, para las marginales t-student, la cópula que mejor ajustó fue una gaussiana con parámetro ρ = 0.87 y para para marginales weibull, la copula que mejor ajustó fue frank. Haciendo uso de esta metodología, fue posible encontrar la asociación de dos variables aleatorias, por medio de las funciones cópula.spa
dc.description.abstractEstimating the strength of the dependence between two random variables is important in data analysis. One method for finding such an association is copula functions, represented as a convenient parametric form for modeling the dependence structure in joint distributions of random variables. There is a wide range of copula functions, so the choice of a suitable copula is one of the great challenges facing the researcher. With this work we seek to propose a copula selection mechanism using analytical and graphical tests, among the graphical tests are the ChiPlot and K-Plot graphs. Among its relevant results it was found that for normal marginals, the best copula is Gaussian with parameter ρ = 0.88, for log-normal marginals, the best fitting copula was a frank with a parameter of 4.438, for t-student marginals, the best fitting copula was a Gaussian with parameter ρ = 0.87 and for weibull marginals, the best fitting copula was frank. Using this methodology, it was possible to find the association of two random variables by means of the copula functions.eng
dc.description.degreelevelPregrado
dc.description.degreenameEstadístico(a)
dc.description.modalityTrabajos de Investigación y/o Extensión
dc.description.tableofcontentsResumen VIIspa
dc.description.tableofcontentsAgradecimientos IXspa
dc.description.tableofcontents1. Introducción 1spa
dc.description.tableofcontents2. Funciones cópula 4spa
dc.description.tableofcontents2.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4spa
dc.description.tableofcontents2.2. Familias de cópulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5spa
dc.description.tableofcontents2.2.1. Cópulas elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6spa
dc.description.tableofcontents2.2.1.1. Cópula gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . .6spa
dc.description.tableofcontents2.2.1.2. Cópula t-student . . . . . . . . . . . . . . . . . . . . . . . . . .6spa
dc.description.tableofcontents2.2.2. Cópulas arquimedianas . . . . . . . . . . . . . . . . . . . . . . . . . . . .7spa
dc.description.tableofcontents2.2.2.1. Cópula clayton . . . . . . . . . . . . . . . . . . . . . . . . . . .7spa
dc.description.tableofcontents2.2.2.2. Cópula gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . .8spa
dc.description.tableofcontents2.2.2.3. Cópula frank . . . . . . . . . . . . . . . . . . . . . . . . . . . .8spa
dc.description.tableofcontents2.2.2.4. Cópula joe . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9spa
dc.description.tableofcontents2.2.3. Cópula de supervivencia . . . . . . . . . . . . . . . . . . . . . . . . . . .9spa
dc.description.tableofcontents2.2.4. Cópulas de valor extremo . . . . . . . . . . . . . . . . . . . . . . . . . .11spa
dc.description.tableofcontents2.3. τ de Kendall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11spa
dc.description.tableofcontents2.4. Métodos gráficos de bondad de ajuste . . . . . . . . . . . . . . . . . . . . . . . .13spa
dc.description.tableofcontents2.4.1. Método Chi-plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13spa
dc.description.tableofcontents2.4.2. Método K-plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14spa
dc.description.tableofcontents3. Modelos de validación cruzada 15spa
dc.description.tableofcontents3.1. Criterio de información de Akaike (AIC) . . . . . . . . . . . . . . . . . . . . . .17spa
dc.description.tableofcontents3.2. Criterio de información bayesiano de Schwarz (BIC) . . . . . . . . . . . . . . . .17spa
dc.description.tableofcontents4. Esquemas de simulación y aplicación 18spa
dc.description.tableofcontents4.1. Modelo con marginales weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . .22spa
dc.description.tableofcontents4.2. Métodos gráficos para detectar dependencia . . . . . . . . . . . . . . . . . . . .24spa
dc.description.tableofcontents4.3. Aplicación de validación cruzada para selección de modelos cópulas . . . . . . .27spa
dc.description.tableofcontents4.4. Aplicación en datos biomédicos . . . . . . . . . . . . . . . . . . . . . . . . . . .29spa
dc.description.tableofcontents5. Conclusiones y recomendaciones 34spa
dc.description.tableofcontents5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34spa
dc.description.tableofcontents5.2. Recomendaciones y futuras investigaciones . . . . . . . . . . . . . . . . . . . . .35spa
dc.description.tableofcontentsA. Código en R para el proceso de simulación 36spa
dc.description.tableofcontentsB. Marginales normal 39spa
dc.description.tableofcontentsC. Marginales log-normal 56spa
dc.description.tableofcontentsD. Marginales t-student 73spa
dc.description.tableofcontentsE. Marginales weibull 90spa
dc.description.tableofcontentsF. Simulación para datos biomédicos 107spa
dc.description.tableofcontentsLista de Tablasspa
dc.description.tableofcontents2.1. Propiedades de familias de cópulas elíticas bivariadas . . . . . . . . . . . . . . .12spa
dc.description.tableofcontents2.2. Propiedades de familias de cópulas arquimedianas bivariadas . . . . . . . . . . .12spa
dc.description.tableofcontents4.1. Nombres de cópulas bivariadas . . . . . . . . . . . . . . . . . . . . . . . . . . . .19spa
dc.description.tableofcontents4.2. Resumen de simulación para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20spa
dc.description.tableofcontents4.3. Resumen de simulación para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21spa
dc.description.tableofcontents4.4. Resumen de simulación para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21spa
dc.description.tableofcontents4.5. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22spa
dc.description.tableofcontents4.6. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23spa
dc.description.tableofcontents4.7. Resumen de simulación para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23spa
dc.description.tableofcontents4.8. AIC y BIC para cópulas ajustadas para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27spa
dc.description.tableofcontents4.9. AIC y BIC para cópulas ajustadas para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27spa
dc.description.tableofcontents4.10. AIC y BIC para cópulas ajustadas para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28spa
dc.description.tableofcontents4.11. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28spa
dc.description.tableofcontents4.12. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28spa
dc.description.tableofcontents4.13. AIC y BIC para cópulas ajustadas para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29spa
dc.description.tableofcontents4.14. Resumen de simulación para datos biomedicos . . . . . . . . . . . . . . . . . . .32spa
dc.description.tableofcontents4.15. AIC y BIC para cópulas ajustadas para datos biomédicos . . . . . . . . . . . . .33spa
dc.description.tableofcontentsB.1. Pares de variables aleatorias marginales normal n = 50, r = 20 . . . . . . . . . .39spa
dc.description.tableofcontentsB.2. Pares de variables aleatorias marginales normal n = 50, r = 40 . . . . . . . . . .40spa
dc.description.tableofcontentsB.3. Pares de variables aleatorias marginales normal n = 50, r = 100 . . . . . . . . .41spa
dc.description.tableofcontentsB.4. Pares de variables aleatorias marginales normal n = 100, r = 20 . . . . . . . . .44spa
dc.description.tableofcontentsB.5. Pares de variables aleatorias marginales normal n = 100, r = 40 . . . . . . . . .45spa
dc.description.tableofcontentsB.6. Pares de variables aleatorias marginales normal n = 100, r = 100 . . . . . . . . .46spa
dc.description.tableofcontentsB.7. Pares de variables aleatorias marginales normal n = 500, r = 20 . . . . . . . . .50spa
dc.description.tableofcontentsB.8. Pares de variables aleatorias marginales normal n = 500, r = 40 . . . . . . . . .51spa
dc.description.tableofcontentsB.9. Pares de variables aleatorias marginales normal n = 500, r = 100 . . . . . . . . .52spa
dc.description.tableofcontentsC.1. Pares de variables aleatorias marginales log-normal n = 50, r = 20 . . . . . . . .56spa
dc.description.tableofcontentsC.2. Pares de variables aleatorias marginales log-normal n = 50, r = 40 . . . . . . . .57spa
dc.description.tableofcontentsC.3. Pares de variables aleatorias marginales log-normal n = 50, r = 100 . . . . . . .58spa
dc.description.tableofcontentsC.4. Pares de variables aleatorias marginales log-normal n = 100, r = 20 . . . . . . .61spa
dc.description.tableofcontentsC.5. Pares de variables aleatorias marginales log-normal n = 100, r = 40 . . . . . . .62spa
dc.description.tableofcontentsC.6. Pares de variables aleatorias marginales log-normal n = 100, r = 100 . . . . . . .64spa
dc.description.tableofcontentsC.7. Pares de variables aleatorias marginales log-normal n = 500, r = 20 . . . . . . .67spa
dc.description.tableofcontentsC.8. Pares de variables aleatorias marginales log-normal n = 500, r = 40 . . . . . . .68spa
dc.description.tableofcontentsC.9. Pares de variables aleatorias marginales log-normal n = 500, r = 100 . . . . . . .69spa
dc.description.tableofcontentsD.1. Pares de variables aleatorias marginales t-student n = 50, r = 20 . . . . . . . . .73spa
dc.description.tableofcontentsD.2. Pares de variables aleatorias marginales t-studen n = 50, r = 40 . . . . . . . . .74spa
dc.description.tableofcontentsD.3. Pares de variables aleatorias marginales t-studen n = 50, r = 100 . . . . . . . .75spa
dc.description.tableofcontentsD.4. Pares de variables aleatorias marginales t-studen n = 100, r = 20 . . . . . . . .78spa
dc.description.tableofcontentsD.5. Pares de variables aleatorias marginales t-studen n = 100, r = 40 . . . . . . . .79spa
dc.description.tableofcontentsD.6. Pares de variables aleatorias marginales t-studen n = 100, r = 100 . . . . . . . .81spa
dc.description.tableofcontentsD.7. Pares de variables aleatorias marginales t-studen n = 500, r = 20 . . . . . . . .84spa
dc.description.tableofcontentsD.8. Pares de variables aleatorias marginales t-studen n = 500, r = 40 . . . . . . . .85spa
dc.description.tableofcontentsD.9. Pares de variables aleatorias marginales t-studen n = 500, r = 100 . . . . . . . .86spa
dc.description.tableofcontentsE.1. Pares de variables aleatorias marginales weibull n = 50, r = 20 . . . . . . . . . .90spa
dc.description.tableofcontentsE.2. Pares de variables aleatorias marginales weibull n = 50, r = 40 . . . . . . . . . .91spa
dc.description.tableofcontentsE.3. Pares de variables aleatorias marginales weibull n = 50, r = 100 . . . . . . . . .92spa
dc.description.tableofcontentsE.4. Pares de variables aleatorias marginales weibull n = 100, r = 20 . . . . . . . . .95spa
dc.description.tableofcontentsE.5. Pares de variables aleatorias marginales weibull n = 100, r = 40 . . . . . . . . .96spa
dc.description.tableofcontentsE.6. Pares de variables aleatorias marginales weibull n = 100, r = 100 . . . . . . . . .98spa
dc.description.tableofcontentsE.7. Pares de variables aleatorias marginales weibull n = 500, r = 20 . . . . . . . . .101spa
dc.description.tableofcontentsE.8. Pares de variables aleatorias marginales weibull n = 500, r = 40 . . . . . . . . .102spa
dc.description.tableofcontentsE.9. Pares de variables aleatorias marginales weibull n = 500, r = 100 . . . . . . . . .103spa
dc.description.tableofcontentsF.1. aplicación datos bimédicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107spa
dc.description.tableofcontentsLista de Figurasspa
dc.description.tableofcontents4.1. Métodos gráficos para la cópula gaussina con ρ = 0.88, para marginales normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24spa
dc.description.tableofcontents4.2. Métodos gráficos para la cópula frank con θ = 4.438, para marginales log-normal con parámetros µ1 = µ2 = 1 y σ1 = σ2 = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24spa
dc.description.tableofcontents4.3. Métodos gráficos para la cópula gaussina con ρ = 0.87, para marginales t-student con parámatros v1 = v2 = n − 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .25spa
dc.description.tableofcontents4.4. Métodos gráficos para la cópula frank con θ = 4.0136, para marginales weibull con parámetros β1 = β2 = 1 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .25spa
dc.description.tableofcontents4.5. Métodos gráficos para la cópula frank con θ = 3.3525, para marginales weibull con parámetros β1 = β2 = 2 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26spa
dc.description.tableofcontents4.6. Métodos gráficos para la cópula survival BB7 con θ1 = 1.61 y θ2 = 4.48, para marginales weibull con parámetros β1 = β2 = 0.5 y λ1 = λ2 = 1 . . . . . . . . . . . . . . . . . . . .26spa
dc.description.tableofcontents4.7. Gráfico de dispersión entre tiempo oficio y micronúcleo . . . . . . . . . . . . . . . . . . .30spa
dc.description.tableofcontents4.8. Histograma y densidad para tiempo oficio . . . . . . . . . . . . . . . . . . . . . . . . .31spa
dc.description.tableofcontents4.9. Histograma y densidad para micronúcleo . . . . . . . . . . . . . . . . . . . . . . . . .31spa
dc.description.tableofcontents4.10. Métodos gráficos para la cópula joe rotada 90 grados para datos biomédicos . . . . . . . . .32spa
dc.identifier.instnameUniversidad de Córdoba
dc.identifier.reponameRepositorio Universidad de Córdoba
dc.identifier.repourlhttps://repositorio.unicordoba.edu.co/
dc.identifier.urihttps://repositorio.unicordoba.edu.co/handle/ucordoba/7859
dc.language.isospa
dc.publisherUniversidad de Córdoba
dc.publisher.facultyFacultad de Ciencias Básicas
dc.publisher.placeMontería, Córdoba - Colombia
dc.publisher.programEstadística
dc.relation.referencesArlot, S. and Celisse, A. (2010). A survey of cross-validation procedures for model selection. Statistics Surveys, 4(none):40 – 79.
dc.relation.referencesCintas, R. (2007). Teoría de cópulas y control de riesgo financiero.
dc.relation.referencesDatapeaker (2022). Técnicas de validación cruzada en aprendizaje automático para un mejor modelo;[consultado el 24 de febrero de 2023]. https://datapeaker.com/big-data/tecnicas-devalidacion-cruzada-en-aprendizaje-automatico-para-un-mejor-modelo/.
dc.relation.referencesFenech, M., Chang, W. P., Kirsch-Volders, M., Holland, N., Bonassi, S., and Zeiger, E. (2003). Humn project: detailed description of the scoring criteria for the cytokinesis-block micronucleus assay using isolated human lymphocyte cultures. Mutation Research/Genetic Toxicology and Environmental Mutagenesis, 534(1-2):65–75.
dc.relation.referencesFisher, N. and Switzer, P. (1985). Chi-plots para evaluar la dependencia. Biometrika, (2):253– 265.
dc.relation.referencesGallardo, B. (2010). Teoría de cópulas y aplicaciones en simulación de riesgos financieros y en ingeniería civil. Doctoral dissertation, Master Thesis, Estadística Aplicada, Universidad de Granada, Granada, España.
dc.relation.referencesGenest, C. and Boies, J. (2003). Detecting dependence with kendall plots. The American Statistician, (4):275–284.
dc.relation.referencesGómez, W. (2017). Análisis de frecuencia hidrológico multivariado para eventos extremos mediante funciones cópula arquimedianas. casos de estudio: cuenca baja del río tunjuelo y región de la mojana (colombia). Departamento de Ingeniería Civil y Agrícola.
dc.relation.referencesJiménez, L. A. (2018). Criterio de akaike para la selección de modelos con transformaciones. Universidad Santo Tomás, pages 10–15.
dc.relation.referencesKozak, A. and Kozak, R. (2003). Does cross validation provide additional information in the evaluation of regression models?. Canadian Journal of Forest Research, (33(4)):976–987.
dc.relation.referencesMorales, M. (2013). Aproximación al análisis de correlación de valores extremos entre tipos de cambio de países emergentes.
dc.relation.referencesMoreno, D. (2012). Método para elegir una cópula arquimediana óptima. Departamento de Estadística.
dc.relation.referencesNelsen, R. (2006). An introduction to copulas. Springer, 2 edition.
dc.relation.referencesOrtego, M. (2014). Estimación bayesiana de cópulas extremales en procesos de poisson. Doctoral dissertation, Ph. D. thesis, Universitat Politecnica de Catalunya.
dc.relation.referencesPastor-Sierra, K., Espitia-Pérez, L., Espitia-Pérez, P., Peñata-Taborda, A., Brango, H., Galeano-Páez, C., Bru-Cordero, O. E., Palma-Parra, M., Díaz, S. M., Trillos, C., Briceño, L., Álvaro J. Idrovo, Miranda-Pacheco, J., Téllez, E., Jiménez-Vidal, L., Coneo-Pretelt, A., Álvarez, A. H., Arteaga-Arroyo, G., Ricardo-Caldera, D., Salcedo-Arteaga, S., Porras-Ramírez, A., and Varona-Uribe, M. (2023). Micronuclei frequency and exposure to chemical mixtures in three colombian mining populations. Science of The Total Environment, 901:165789.
dc.relation.referencesPérez-Planells, L., Delegido, J., Rivera-Caicedo, J. P., and Verrelst, J. (2015). Análisis de métodos de validación cruzada para la obtención robusta de parámetros biofísicos. Revista de teledetección, (44):55–65.
dc.relation.referencesSCIENCE, D. (2020). Validación cruzada k-fold;[consultado el 24 de febrero de 2023]. https://datascience.eu/es/aprendizaje-automatico/validacion-cruzada-de-k-fold//.
dc.relation.referencesSepúlveda, W. and Garzón, L. (2017). Modelación conjunta de variables meteorológicas medidas en la estación la sirena en el valle del cauca a través de funciones cópula. Universidad del Valle.
dc.relation.referencesServices, A. W. (2022). Validación cruzada;[consultado el 19 de marzo de 2022]. https://docs.aws.amazon.com/es-es/machine-learning/latest/dg/cross-validation.html.
dc.rightsCopyright Universidad de Córdoba, 2023
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.ddc500 - Ciencias naturales y matemáticas
dc.subject.keywordsCopula functioneng
dc.subject.keywordsDependenceeng
dc.subject.keywordsBivariate dataeng
dc.subject.keywordsKendall’s τeng
dc.subject.keywordsGraphical methodseng
dc.subject.proposalFunción cópulaspa
dc.subject.proposalDependenciaspa
dc.subject.proposalDatos bivariadosspa
dc.subject.proposalτ de kendallspa
dc.subject.proposalMétodos gráficosspa
dc.titleMetodología para modelar la asociación entre dos variables aleatorias continuas a través de funciones cópula: aplicación en datos biomédicosspa
dc.typeTrabajo de grado - Pregrado
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication
Archivos
Bloque original
Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
martinezhernandezmairaalejandra.pdf
Tamaño:
2.15 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
Formato de Autorización de Publicación.pdf
Tamaño:
247.71 KB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
15.18 KB
Formato:
Item-specific license agreed upon to submission
Descripción: