Morales Ospina, Victor HugoCallejas Bonolis, Karen Yulieth2024-07-122024-07-122024-07-11https://repositorio.unicordoba.edu.co/handle/ucordoba/8382El propósito de esta investigación fue presentar la teoría estadística empleada para el análisis de datos funcionales a través de una revisión exhaustiva de la literatura. Además, se demostró su aplicación en datos concretos relacionados con la calidad del aire en Santiago de Chile y los índices de precios al consumidor en Colombia. El análisis de datos funcionales permite capturar la dinámica y estructura de dependencia de los datos, a diferencia de los métodos tradicionales que se basan en observaciones discretas. Las bases de Fourier y Spline fueron los dos métodos utilizados para las bases de funciones. Para cada aplicación, se seleccionó la base que permitió un ajuste de datos más efectivo, teniendo en cuenta un menor error cuadrático medio (RMS). Además, para demostrar un posible complemento entre estas dos metodologías, se presenta una introducción de algunas técnicas de series temporales para modelar la dinámica de los datos junto con los procedimientos de análisis de datos funcionales. Los resultados de estos métodos muestran resultados significativos sobre los índices de precios al consumidor y la calidad del aire. En Santiago de Chile, las concentraciones de PM2.5 y PM10 superan los límites recomendados por la OMS debido a las fuentes locales de contaminantes y los cambios estacionales. Por otro lado, se puede observar en la base de datos de la inflación en Colombia que durante los años 2016 y 2017 el país experimentó su nivel más alto de inflación. El análisis de regresión funcional muestra patrones interesantes en la variación del PM10 a lo largo del tiempo. El análisis de series de tiempo muestra una disminución en los niveles de PM2.5 en Santiago de Chile para diciembre de 2016. El análisis estadístico mejora con la integración de estas dos técnicas en los datos.The purpose of this research was to present the statistical theory used for the analysis of functional data through an exhaustive review of the literature. In addition, its application was demonstrated in specific data related to air quality in Santiago de Chile and consumer price indices in Colombia. Functional data analysis allows us to capture the dynamics and dependency structure of the data, unlike traditional methods that are based on discrete observations. Fourier and Spline bases were the two methods used for function bases. For each application, the base that allowed a more effective data fit was selected, taking into account a lower root mean square (RMS) error. Furthermore, to demonstrate a possible complement between these two methodologies, an introduction of some time series techniques for modeling data dynamics is presented along with functional data analysis procedures. The results of these methods show significant results on consumer price indices and air quality. In Santiago, Chile, concentrations of PM2.5 and PM10 exceed the limits recommended by the who due to local sources of pollutants and seasonal changes. On the other hand, it can be observed in the inflation database in Colombia that during the years 2016 and 2017 the country experienced its highest level of inflation. Functional regression analysis shows interesting patterns in PM10 variation over time. Time series analysis shows a decrease in PM2.5 levels in Santiago, Chile for December 2016. Statistical analysis improves with the integration of these two techniques into the data.ResumenAgradecimientosIntroducción1. Análisis de Datos Funcionales1.1. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.1. Análisis de datos funcionales (ADF) . . . . . . . . . . . . . . . . . . . . . 41.1.2. Conceptos Básicos del ADF . . . . . . . . . . . . . . . . . . . . . . . . . 41.1.2.1. Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 41.1.2.2. Elementos aleatorios en el espacio L2 . . . . . . . . . . . . . . . 51.1.2.3. Variable funcional . . . . . . . . . . . . . . . . . . . . . . . . . 51.1.2.4. Medidas descriptivas funcionales . . . . . . . . . . . . . . . . . 61.1.3. Funciones base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.1.3.1. Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.1.3.2. B − Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.1.3.3. Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112. Metodología2.1. Fases de la Investigación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.1.1. Revisión de la literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.1.2. Recopilación y Preprocesamiento de Datos . . . . . . . . . . . . . . . . . 132.1.3. Análisis de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.4. Interpretación de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.5. Presentación de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . 153. Aplicaciones3.1. Mediciones del PM2.5 y PM10 en Santiago de Chile . . . . . . . . . . . . . . . . 163.1.1. Descripción de la base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.1.2. PM2.5 y PM10 como un dato funcional . . . . . . . . . . . . . . . . . . . 193.1.3. Análisis descriptivo funcional . . . . . . . . . . . . . . . . . . . . . . . . 193.2. Índices de Precios al Consumidor en Colombia . . . . . . . . . . . . . . . . . . . 263.2.1. Descripción de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.2.2. IPC como un dato funcional . . . . . . . . . . . . . . . . . . . . . . . . . 293.3. Modelos de Regresión Funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.3.1. Modelos de Regresión Funcional Lineal . . . . . . . . . . . . . . . . . . . 343.3.2. Modelos de Regresión Funcional Retardado . . . . . . . . . . . . . . . . . 353.3.3. Modelos lineales funcionales para respuestas escalares . . . . . . . . . . . 353.4. Introducción a las series temporales . . . . . . . . . . . . . . . . . . . . . . . . . 383.4.1. Ajuste, estimación y selección del modelo ARIMA . . . . . . . . . . . . . 423.4.2. Florida ARIMA(1,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.4.3. Florida ARIMA(2,1,3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.4.4. Puente Alto ARIMA(1,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . 463.4.5. Las Condes ARIMA(0,1,3) . . . . . . . . . . . . . . . . . . . . . . . . . . 483.4.6. Las Condes ARIMA(2,1,2) . . . . . . . . . . . . . . . . . . . . . . . . . . 494. Conclusionesapplication/pdfspaCopyright Universidad de Córdoba, 2024Análisis de datos funcionales: teoría y aplicacionesTrabajo de grado - PregradoAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)info:eu-repo/semantics/openAccessAnálisis funcionalFunciones baseRegresión funcionalSeries de tiempoARIMAPM2.5PM10IPCFunctional analysisBase functionsFunctional regressionTime seriesUniversidad de Córdobahttps://repositorio.unicordoba.edu.cohttp://purl.org/coar/access_right/c_abf2