Publicación: Análisis de datos funcionales: teoría y aplicaciones
dc.audience | ||
dc.contributor.advisor | Morales Ospina, Victor Hugo | |
dc.contributor.author | Callejas Bonolis, Karen Yulieth | |
dc.contributor.jury | Tovar Falon, Roger de Jesús | |
dc.contributor.jury | Meledez Surmay, Rafael | |
dc.date.accessioned | 2024-07-12T14:04:55Z | |
dc.date.available | 2024-07-12T14:04:55Z | |
dc.date.issued | 2024-07-11 | |
dc.description.abstract | El propósito de esta investigación fue presentar la teoría estadística empleada para el análisis de datos funcionales a través de una revisión exhaustiva de la literatura. Además, se demostró su aplicación en datos concretos relacionados con la calidad del aire en Santiago de Chile y los índices de precios al consumidor en Colombia. El análisis de datos funcionales permite capturar la dinámica y estructura de dependencia de los datos, a diferencia de los métodos tradicionales que se basan en observaciones discretas. Las bases de Fourier y Spline fueron los dos métodos utilizados para las bases de funciones. Para cada aplicación, se seleccionó la base que permitió un ajuste de datos más efectivo, teniendo en cuenta un menor error cuadrático medio (RMS). Además, para demostrar un posible complemento entre estas dos metodologías, se presenta una introducción de algunas técnicas de series temporales para modelar la dinámica de los datos junto con los procedimientos de análisis de datos funcionales. Los resultados de estos métodos muestran resultados significativos sobre los índices de precios al consumidor y la calidad del aire. En Santiago de Chile, las concentraciones de PM2.5 y PM10 superan los límites recomendados por la OMS debido a las fuentes locales de contaminantes y los cambios estacionales. Por otro lado, se puede observar en la base de datos de la inflación en Colombia que durante los años 2016 y 2017 el país experimentó su nivel más alto de inflación. El análisis de regresión funcional muestra patrones interesantes en la variación del PM10 a lo largo del tiempo. El análisis de series de tiempo muestra una disminución en los niveles de PM2.5 en Santiago de Chile para diciembre de 2016. El análisis estadístico mejora con la integración de estas dos técnicas en los datos. | spa |
dc.description.abstract | The purpose of this research was to present the statistical theory used for the analysis of functional data through an exhaustive review of the literature. In addition, its application was demonstrated in specific data related to air quality in Santiago de Chile and consumer price indices in Colombia. Functional data analysis allows us to capture the dynamics and dependency structure of the data, unlike traditional methods that are based on discrete observations. Fourier and Spline bases were the two methods used for function bases. For each application, the base that allowed a more effective data fit was selected, taking into account a lower root mean square (RMS) error. Furthermore, to demonstrate a possible complement between these two methodologies, an introduction of some time series techniques for modeling data dynamics is presented along with functional data analysis procedures. The results of these methods show significant results on consumer price indices and air quality. In Santiago, Chile, concentrations of PM2.5 and PM10 exceed the limits recommended by the who due to local sources of pollutants and seasonal changes. On the other hand, it can be observed in the inflation database in Colombia that during the years 2016 and 2017 the country experienced its highest level of inflation. Functional regression analysis shows interesting patterns in PM10 variation over time. Time series analysis shows a decrease in PM2.5 levels in Santiago, Chile for December 2016. Statistical analysis improves with the integration of these two techniques into the data. | eng |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Estadístico(a) | |
dc.description.modality | Monografías | |
dc.description.tableofcontents | Resumen | spa |
dc.description.tableofcontents | Agradecimientos | spa |
dc.description.tableofcontents | Introducción | spa |
dc.description.tableofcontents | 1. Análisis de Datos Funcionales | spa |
dc.description.tableofcontents | 1.1. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 | spa |
dc.description.tableofcontents | 1.1.1. Análisis de datos funcionales (ADF) . . . . . . . . . . . . . . . . . . . . . 4 | spa |
dc.description.tableofcontents | 1.1.2. Conceptos Básicos del ADF . . . . . . . . . . . . . . . . . . . . . . . . . 4 | spa |
dc.description.tableofcontents | 1.1.2.1. Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 4 | spa |
dc.description.tableofcontents | 1.1.2.2. Elementos aleatorios en el espacio L2 . . . . . . . . . . . . . . . 5 | spa |
dc.description.tableofcontents | 1.1.2.3. Variable funcional . . . . . . . . . . . . . . . . . . . . . . . . . 5 | spa |
dc.description.tableofcontents | 1.1.2.4. Medidas descriptivas funcionales . . . . . . . . . . . . . . . . . 6 | spa |
dc.description.tableofcontents | 1.1.3. Funciones base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 | spa |
dc.description.tableofcontents | 1.1.3.1. Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 | spa |
dc.description.tableofcontents | 1.1.3.2. B − Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 | spa |
dc.description.tableofcontents | 1.1.3.3. Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 | spa |
dc.description.tableofcontents | 2. Metodología | spa |
dc.description.tableofcontents | 2.1. Fases de la Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 | spa |
dc.description.tableofcontents | 2.1.1. Revisión de la literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 | spa |
dc.description.tableofcontents | 2.1.2. Recopilación y Preprocesamiento de Datos . . . . . . . . . . . . . . . . . 13 | spa |
dc.description.tableofcontents | 2.1.3. Análisis de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 | spa |
dc.description.tableofcontents | 2.1.4. Interpretación de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 14 | spa |
dc.description.tableofcontents | 2.1.5. Presentación de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 15 | spa |
dc.description.tableofcontents | 3. Aplicaciones | spa |
dc.description.tableofcontents | 3.1. Mediciones del PM2.5 y PM10 en Santiago de Chile . . . . . . . . . . . . . . . . 16 | spa |
dc.description.tableofcontents | 3.1.1. Descripción de la base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 | spa |
dc.description.tableofcontents | 3.1.2. PM2.5 y PM10 como un dato funcional . . . . . . . . . . . . . . . . . . . 19 | spa |
dc.description.tableofcontents | 3.1.3. Análisis descriptivo funcional . . . . . . . . . . . . . . . . . . . . . . . . 19 | spa |
dc.description.tableofcontents | 3.2. Índices de Precios al Consumidor en Colombia . . . . . . . . . . . . . . . . . . . 26 | spa |
dc.description.tableofcontents | 3.2.1. Descripción de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 | spa |
dc.description.tableofcontents | 3.2.2. IPC como un dato funcional . . . . . . . . . . . . . . . . . . . . . . . . . 29 | spa |
dc.description.tableofcontents | 3.3. Modelos de Regresión Funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 | spa |
dc.description.tableofcontents | 3.3.1. Modelos de Regresión Funcional Lineal . . . . . . . . . . . . . . . . . . . 34 | spa |
dc.description.tableofcontents | 3.3.2. Modelos de Regresión Funcional Retardado . . . . . . . . . . . . . . . . . 35 | spa |
dc.description.tableofcontents | 3.3.3. Modelos lineales funcionales para respuestas escalares . . . . . . . . . . . 35 | spa |
dc.description.tableofcontents | 3.4. Introducción a las series temporales . . . . . . . . . . . . . . . . . . . . . . . . . 38 | spa |
dc.description.tableofcontents | 3.4.1. Ajuste, estimación y selección del modelo ARIMA . . . . . . . . . . . . . 42 | spa |
dc.description.tableofcontents | 3.4.2. Florida ARIMA(1,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 | spa |
dc.description.tableofcontents | 3.4.3. Florida ARIMA(2,1,3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 | spa |
dc.description.tableofcontents | 3.4.4. Puente Alto ARIMA(1,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . 46 | spa |
dc.description.tableofcontents | 3.4.5. Las Condes ARIMA(0,1,3) . . . . . . . . . . . . . . . . . . . . . . . . . . 48 | spa |
dc.description.tableofcontents | 3.4.6. Las Condes ARIMA(2,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . 49 | spa |
dc.description.tableofcontents | 4. Conclusiones | spa |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad de Córdoba | |
dc.identifier.repourl | https://repositorio.unicordoba.edu.co | |
dc.identifier.uri | https://repositorio.unicordoba.edu.co/handle/ucordoba/8382 | |
dc.language.iso | spa | |
dc.publisher | Universidad de Córdoba | |
dc.publisher.faculty | Facultad de Ciencias Básicas | |
dc.publisher.place | Montería, Córdoba, Colombia | |
dc.publisher.program | Estadística | |
dc.relation.references | [1] Ramsay, J. O., & Silverman, B. W. (2005). Functional data analysis (2nd ed.). Springer. | |
dc.relation.references | [2] Ramsay, J. O., & Dalzell, C. J. (1991). Some tools for functional data analysis. Journal of the Royal Statistical Society: Series B (Methodological), 53(3), 539- 572. https://www.jstor.org/stable/2345586 | |
dc.relation.references | [3] Calderón, J. (2021). Estudio Demográfico: Análisis de Datos Funcionales (ADF) Aplicado a las Principales Causas de mortalidad en el ecuador 1997 − 2021. | |
dc.relation.references | [4] Calcetero, S. (2017). Análisis estadístico de datos funcionales y su aplicación en el estudio del PM10 en Bogotá, Colombia. Tesis de maestría, Universidad. Repositorio institucional. | |
dc.relation.references | [5] Organización Mundial de la Salud.(2016). Contaminación del aire. https://www.paho.org/es/temas/calidad-aire | |
dc.relation.references | [6] Organización Mundial de la Salud. (2022). Contaminación del aire ambiente (exterior). https://www.who.int/es/news-room/fact-sheets/detail/ambient- (outdoor)-air-quality-and-health | |
dc.relation.references | [7] Faster Capital.(sf). Compresión del índice de precios al consumidor y su papel en la medición de la inflación. https://fastercapital.com/es/contenido/Comprension-del-indice-de-preciosal- consumidor-y-su-papel-en-la-medicion-de-la-inflacion.html | |
dc.relation.references | [8] Navarro, V. (2004). Análisis de Datos Funcionales Implementación y Aplicación. | |
dc.relation.references | [9] Kokoszka,P & Reimherr,P.(2018). Introduction to Functional Data Analysis. 1ª ed. | |
dc.relation.references | [10] Ramsay, J. (1982). When the data are functions. Psychometrika 47, 379–396. | |
dc.relation.references | [11] Grenander.(1950). Procesos estocásticos e inferencia estadística. Arkiv para Matematik, 1(3), 195-277. | |
dc.relation.references | [12] Rao, C.R. (1958). Some statistical methods for comparison of growth curves. Biometrics, 14, 1–17. | |
dc.relation.references | [13] Wang, D., Zhong, Z., Bai, K., & He, L. (2019). Spatial and Temporal Variabilities of PM2.5 Concentration in China Using Functional Data Analysis. | |
dc.relation.references | [14] Gómez, C., Montejo, O., & Moreno, A. (2022). Un vistazo a las transacciones desde el análisis de datos funcionales. Comunicaciones En Estadística, 15(1), 48–77. | |
dc.relation.references | [15] Plazola, R. (2013). Monitoreo de datos funcionales. Tesis de maestría, Centro de Investigación en Matemáticas, AC, México. | |
dc.relation.references | [16] Murillo, L. (2021). Estudio de la evolución mundial del Covid-19 mediante análisis de datos funcionales. Tesis de maestría, universidad de granada. | |
dc.relation.references | [17] Aristizabal, J. (2011). Metodología estadística para el análisis de datos funcionales cerebrales: Una aproximación con potenciales evocados. Tesis de maestría, universidad nacional. | |
dc.relation.references | [18] Ramsay, J. O., Hooker, G., & Graves, S. (2009). Functional data analysis with R and MATLAB. Springer. https://doi.org/10.1007/978-0-387-98185-7 | |
dc.relation.references | [19] Ferraty, F., & Vieu, P. (2006). Nonparametric Functional Data Analysis: Theory and Practice. Springer. | |
dc.relation.references | [20] Marrero, I. (2011). Espacios de Hilbert. Universidad de la Laguna. | |
dc.relation.references | [21] Kokoszka, P. & Reimherr, M. (2017). Inference for Functional Data with Applications. Chapman Hall/CRC Tests in Statistical Science. | |
dc.relation.references | [22] Hsing, T., & Eubank, R. (2015). Theoretical foundations of functional data analysis, with an introduction to linear operator. Wiley Series in Probability and Statistics. | |
dc.relation.references | [23] Horváth, L & Kokoszka, P.(2012). Introduction to Functional Data Analysis. Springer - Verlag,New York. | |
dc.relation.references | [24] Rencher, A.C.(1998). Multivariante Statistical Inference and Applications. Springer - Verlag. | |
dc.relation.references | [25] Boor, C. (2001) A practical guide to Spline. New York, Springer - Velarg. | |
dc.relation.references | [26] Paley, C., & Wiener, N. (1934). Fourier transforms in the complex domain. Collaq Publ, 19. AMS, New York. | |
dc.relation.references | [27] Ramsay, J., & Silverman, B. (2002). Applied functional analysis. Springer-Verlag. | |
dc.relation.references | [28] Comisión Nacional del Medio Ambiente. (2003). Norma de Calidad Primaria de Aire para Partículas Totales en Suspensión (PTS) [Norma]. Diario Oficial. | |
dc.relation.references | [29] Sistema de Información Nacional de Calidad del Aire. (s.f.) https://sinca.mma.gob.cl | |
dc.relation.references | [30] Ministerio del Medio Ambiente. (2023). Normativa aplicable - Sistema de Información Nacional de Calidad del Aire. https://sinca.mma.gob.cl/index.php/pagina/index/id/norma | |
dc.relation.references | [31] Air Quality Standards. (2023). https://www3.epa.gov/ttncatc1/cica/airqs.html | |
dc.relation.references | [32] Matus, P., & Lucero, R. (2002). Norma Primaria de la calidad del Aire. Revista Chilena de Enfermedades Respiratorias, 18, 112-122. | |
dc.relation.references | [33] Revista Internacional de Contaminación Ambiental. (2017). Estudio sobre la dinámica temporal de material particulado PM10 emitido en Cochabamba, Bolivia. 33(3), 437-448. | |
dc.relation.references | [34] Departamento Administrativo Nacional de Estadística. (2009). Índice de Precios al Consumidor, Colección Documentos - Actualización, Núm. 62. Bogotá, DC. | |
dc.relation.references | [35] Cue Mancera, A. (2023). Samuelson y la enseñanza de la teoría económica. Análisis Económico, 38(2), 297-324. | |
dc.relation.references | [36] Argandoña, A. (1990). El Pensamiento Económico De Milton Friedman. Universidad de Navarra, 20-30. | |
dc.relation.references | [37] Torres, T. A. H. (2023). ¿Cómo se calcula la inflación y por qué afecta a los colombianos? El Tiempo. https://www.eltiempo.com/economia/finanzaspersonales/ ipc-2023-como-se-calcula-la-inflacion-y-por-que-afecta-a-losciudadanos- 775784[2] | |
dc.relation.references | [38] Banco de la República. (2023). Política monetaria: La estrategia de la inflación objetivo en Colombia. https://www.banrep.gov.co/es/política-monetaria-estrategiainflación- objetivo-Colombia[1] | |
dc.relation.references | [39] DANE. (2024). Índice de Precios al Consumidor. https://www.dane.gov.co/index.php/estadisticas-por-tema/precios-ycostos/ indice-de-precios-al-consumidor-ipc[1] | |
dc.relation.references | [40] Banco de la República. (2023). Estadísticas económicas. https://totoro.banrep.gov.co/estadisticaseconomicas/[1] | |
dc.relation.references | [41] James, G. M., Witten, D., Hastie, T., & Tibshirani, R. (2021). An introduction to statistical learning: With applications in R (2nd ed.). Springer. https://doi.org/10.1007/978-1-0716-1418-1 | |
dc.relation.references | [42] Ramsay, J. O., & Silverman, B. W. (2005). Functional Data Analysis. Springer. | |
dc.relation.references | [43] Bosq, D. (2000). Linear processes in function spaces: theory and applications. Springer Science Business Media. | |
dc.relation.references | [44] Christina, M., Mastrangelo. (1998). Introduction to Time Series. Journal of Quality Technology, 31(1), 128-129. Available from: 10.1080/00224065.1999.11979906. | |
dc.relation.references | [45] J., C., Hardin. (1986). Introduction to time series analysis. | |
dc.relation.references | [46] Chris, Chatfield. (2002). Analysis of Time Series : An Introduction Ed. 6. | |
dc.relation.references | [47] Douglas, C., Montgomery., Cheryl, L., Jennings., Murat, Kulahci., James, R., Broyles., Rachel, T., Johnson., Christopher, J., Rigdon. (2008). Introduction to time series analysis and forecasting : solutions manual to accompany. | |
dc.relation.references | [48] Gebhard, Kirchgässner., Jürgen, Wolters. (2006). Introduction and Basics. 1-25. Available from: 10.1007/978-3-540-73291-4-1 | |
dc.relation.references | [49] García, P. (2021). Variabilidad temporal de los contaminantes del aire PM10 y PM2.5 en el corredor vial Cajicá-Zipaquirá, Cundinamarca Trabajo de grado, Universidad Militar Nueva Granada. | |
dc.relation.references | [50] Botia, J. (2009). Análisis de series temporales TIIA, Primer cuatrimestre. Universidad de Murcia. | |
dc.relation.references | [51] Sáenz, M. C., Pérez, E., Tobías, A., Saurina, C., Barceló, M. A., & Ballester, F. (1999). Métodos de series temporales en los estudios epidemiológicos sobre contaminación atmosférica. Revista Española de Salud Pública, 73(2). | |
dc.relation.references | [52] Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic Control, 19(6), 716-723. | |
dc.relation.references | [53] Álvarez, P. (2020). Series de tiempo de datos funcionales. Tesis de maestría, Universidad de Santiago de Compostela]. Repositorio Institucional USC. | |
dc.relation.references | [54] R Core Team. (2022) R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.Rproject. org/. | |
dc.rights | Copyright Universidad de Córdoba, 2024 | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject.keywords | Functional analysis | |
dc.subject.keywords | Base functions | |
dc.subject.keywords | Functional regression | |
dc.subject.keywords | Time series | |
dc.subject.proposal | Análisis funcional | |
dc.subject.proposal | Funciones base | |
dc.subject.proposal | Regresión funcional | |
dc.subject.proposal | Series de tiempo | |
dc.subject.proposal | ARIMA | |
dc.subject.proposal | PM2.5 | |
dc.subject.proposal | PM10 | |
dc.subject.proposal | IPC | |
dc.title | Análisis de datos funcionales: teoría y aplicaciones | spa |
dc.type | Trabajo de grado - Pregrado | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
dc.type.content | Text | |
dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
dc.type.version | info:eu-repo/semantics/acceptedVersion | |
dspace.entity.type | Publication |
Archivos
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 15.18 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: