La distribución logarítmica normal (LN) es una distribución de probabilidad con un logaritmo distribuido normalmente que se obtiene como una transformación de la distribución normal ordinaria y se suele utilizar a menudo en situaciones en las que los valores presentan sesgo a la derecha como, por ejemplo, para determinar precios de acciones, precios de propiedades inmobiliarias, escalas salariales, tamaños de depósitos de aceite entre otros. En muchas de estas situaciones, la
asimetría de la distribución y su curtosis están por encima o por debajo de lo esperado para el modelo LN, por lo que es necesario pensar en un modelo más flexible que logres tal desviación al modelar datos positivos.
Varios autores han introducido familias de distribuciones que permiten modelar variables con soporte positivo y diferentes grados de asimetría y curtosis. Una
de las más reconocidas corresponde al modelo ln-skew-normal (LSN), la cual fue estudiada por Mateus-Figueras (2003-2004), quien estudia las propiedades de este
modelo.
Es de notar que esta distribución es una extensión de la distribución LN para modelar la estructura asimétrica presente en los datos, no obstante presenta una dificultad ya que su matriz de información es singular cuando el parámetro de asimetría es cercano a cero, ademas existe dificultad para la estimación de este
parámetro, Olmos et al. (2016) presentan el modelo bimodal Birnbaum - Saunder (1950), el cual ademas de ajustar datos positivos, su matriz de información es no
singular.
Distribuciones para ajustar datos positivos se limitan generalmente a la gama, weibull, exponencial, Birnbaum-Saunders (1950) y LN. Sin embargo, estas distribuciones
solo ajustan datos con distribución unimodal con alta o baja asimetría, es decir que estos modelos no pueden ser aplicados cuando la distribución de los datos
es bimodal o multimodal. Para datos positivos con comportamiento bimodal, son pocos los autores que han propuesto distribuciones que ajusten este tipo de
información; destacándose Bolfarine et al. (2011) con el modelo The log-bimodal-skew-normal model (logBSN) que en español corresponde a la función de densidad
de la distribución logarítmica bimodal normal asimétrica y Venegas et al. (2016) con the Log-Alpha-Skew-Normal Model (LASN), en español es la función de densidad
de la distribución logarítmica alfa normal asimétrica. Sin embargo, estas dos distribuciones presentan el problema que sus matrices de información son singulares, cuando su parámetro de asimetría se acerca a la frontera de cero, dado que estas se originan como extensión de la distribución normal asimétrica de Azzalini, (1985). Otra posible solución es la mezcla de distribuciones LN, pero como es bien conocido en la literatura, este modelo presenta problemas de identificabilidad en la estimación de sus parámetros.
Una solución a los inconvenientes presentados con las distribuciones arriba mencionadas es usar otras familias de distribuciones bases que no presenten problemas en
su matriz de información ni problemas de identificabilidad en la estimación de sus parámetros. Como solución a la problemática antes descrita, este trabajo presenta una nueva distribución con la cual se pueden ajustar distribuciones de soporte positivo de tipo bimodal o multimodal basadas en la distribución ln-alfa-potencia (LAP) Martínez-Flórez et al. (2014) y el modelo beta-normal asimétrico exponenciado (PBSN), estudiado recientemente por Martínez et al. (2018). Esta nueva distribución incluye nuevos parámetros que la hacen mas flexible en términos de forma (bimodalidad y multimodalidad), asimetría y curtosis que el modelo LN, puesto que se logra modelar datos con distribución unimodal, bimodal y multimodal para datos positivos, con asimetria y curtosis por fuera del rango permitido por la distribución LN.
Cabe resaltar que las distribuciones para datos no-negativos se utilizan principalmente en el campo de la teoría de la con fiabilidad (Birnbaum-Saunders (1950)),
el cual es el análisis de datos de tiempo de falla (es la metodología estadística que se usa para determinar la con fiabilidad de una población de dispositivos y predecir el porcentaje de fallas potenciales). Las distribuciones mas utilizadas en la modelacion de datos positivos son las distribuciones exponencial, weibull, gamma, LN y Birnbaum-Saunders, entre otras. En los últimos tiempos se ha estado utilizando el modelo half -normal para el análisis de sobrevivencia o extensiones de este, como por ejemplo la extensión realizada por Elal-Olivero et al. (2009).
A pesar de que los modelos LN y LSN Mateus-Figueras et al. (2003-2004) tienen amplia aplicabilidad en datos positivos con fuerte asimetría positiva, el modelo Birnbaum-Saunders se muestra como una alternativa más utilizada para ajustar datos de sobrevivencia y fatiga de materiales. Sin embargo, todos estos modelos solo pueden ajustar datos de car acter unimodal, siendo modelos no flexibles para observaciones de tipo bimodal o multimodal.
Así, es poca la literatura existente sobre distribuciones que logren ajustar datos positivos que presenten comportamiento bimodal y a un más complejo si la distribución presenta un comportamiento multimodal. Por otro lado, Durrans (1992) introdujo la distribución de estadísticas de orden fraccionaria, la cual genera un buen modelo base para la creación de distribuciones que modelen variables asimétricas, con matriz de información no singular para valores cercanos a uno en el parámetro de asimetría.
Una extensión de este modelo al caso de datos bimodales fue estudiada por Bolfarineet al. (2013), denominada distribución bimodal AP; este modelo también tiene la característica de que su matriz de información es no singular. Otra extensión del modelo AP para el caso de datos positivos fue realizada por Martínez-Flórez et al.(2014) quienes introducen el modelo ln-potencia normal (LPN), cuya matriz de información resulto ser no singular. Recientemente Martínez et al. (2018) proponen una familia de distribuciones PBSN; la cual es otra extensión del modelo AP que logra ajustar datos multimodales además, su matriz de información también resulta ser no singular.
En vista de lo anterior, aprovechando la no singularidad del modelo AP y la flexibilidad para el caso de datos bimodales de los modelos bimodal AP y multimodal PBSN, resulta interesante estudiar el comportamiento de la distribución resultante que mezcla la estructura genérica AP y las distribuciones base LN, LPN, bimodal AP y PBSN. La justificación de esta mezcla es que dadas las características del modelo AP al realizar la extensión de esta, se espera que la matriz de información del modelo resultante no presente los problemas de singularidad de los modelos ya estudiados en la literatura y se genere una distribución flexible capaz de modelar datos positivos de tipo bimodal y multimodal, si esto no sucede se llevar a a cabo una reparametrización adecuada.
El modelo estudiado en el presente trabajo contiene la distribución LN como un caso particular y se estudiaran sus principales propiedades estadísticas así como el proceso inferencial de estimación de sus parámetros, matriz de información y distribución asintótica del vector de estimadores de los parámetros.