Estadística


Análisis de series temporales


PRÁCTICA 1

Es una serie de datos mensuales de vehículos que pasan por el puente de San Francisco.

Análisis de series temporales

1

Gráfico horizontal:

- Podemos ver que presenta un comportamiento estacional, pues hay períodos que se repiten.

- En promedio hay un crecimiento (tendencia creciente en la serie), pero este crecimiento no es completamente regular.

- Hay dos períodos de ruptura a lo largo de la serie(en torno al 70-80 hay un decrecimiento muy acusado), luego se recupera la línea ascendente y recupera el nivel que habría tenido la serie si no hubiera ninguna ruptura. Hay una nueva caída y además afecta al ciclo. Se sabe que estas caídas corresponden a períodos de crisis económicas.

- Las amplitudes de cada uno de estos ciclos son bastante homogéneas en general.

ANÁLISIS DESCRIPTIVO DE LA SERIE

Haciendo la descomposición de todos los factores que intervienen:

- Tendencia (creciente)

- Oscilaciones

- Residuos

Análisis de intervención, analiza el efecto de factores anómalos, por ejemplo las rupturas.

Análisis de series temporales

2

Gráfico de Medias Móviles:

En este gráfico hemos tomado como longitud estacional el año (12 meses) y el método aditivo (los rangos de variación son homogéneos).

Es la misma serie sin unir los puntos. Se observa un suavizamiento de todas la variaciones y se ve la variación media.

Análisis de series temporales

3

Estimación de la componente estacional:

En este gráfico de la componente estacional estimada a la serie se le resta el promedio de cada uno de ellos. Aparece un promedio de cada año.

Se observa una subida acusada en el mes de agosto y una bajada en enero.

Análisis de series temporales

4

Gráfico de los residuos:

En este gráfico no se observa ningún padrón de comportamiento.

Las dos caídas siguen apareciendo. El análisis descriptivo llega hasta aquí y las rupturas se han detectado tanto en la tendencia como en los residuos.

Análisis de series temporales

5

Serie una vez extraída la componente estacional:

Representamos la serie quitando el efecto de los factores estacionarios (datos ajustados sin estacionalidad).

La información más útil a la hora de analizar una serie está incluida en los residuos, a efectos de predicción.

PRÁCTICA 2

Generamos los valores de una serie temporal mediante un modelo de ruido blanco Gaussiano (media 0 y varianza constante).

Para ello generamos de forma aleatoria 100 valores de una distribución normal de media cero y varianza uno. Vamos a ver la forma en que van alternando los signos.

Análisis de series temporales

6

Gráfico Horizontal:

Observamos que en el gráfico horizontal de la serie y vemos la forma que presenta.

Si calculamos el correlograma estimado para esta serie debe salir parecido al teórico para un ruido blanco.

Análisis de series temporales

7

Función de Autocorrelación:

El gráfico del correlograma estimado es distinto al teórico aunque se parecerá. En él aparecen 30 datos (aproximadamente un tercio de los datos observados).

En el teórico todos los valores son cero, aquí aparecen positivos y negativos. Las bandas rojas indican un intervalo de confianza al 95 %.

Podemos hacer un contraste para ver si los valores del correlograma estimado son distintos de cero, cuando algún valor se sale fuera de las bandas es porque es significativamente distinto de cero, es decir, bajo la hipótesis nula de ser igual a cero, se espera con el 95% de probabilidad que el valor del correlograma estimado este dentro de las bandas. Por lo que si estamos haciendo 30 contrastes se espera que un 5% de los valores pueden salirse de las bandas.

Hay que mirar el correlograma punto a punto y globalmente. Si en una serie hay estacionalidad, es esperable que haya algún tipo de dependencia, por tanto hay que ver si hay componentes estacionales.

Análisis de series temporales

8

Función de Autocorrelación:

Este correlograma corresponde a una muestra de 1000 valores generados de forma aleatoria de una distribución N(0,1). En este correlograma las bandas de confianza son más estrechas que en el anterior al haber aumentado el número de observaciones. La función de autocorrelación se ha reducido mucho.

Si el primer valor del correlograma se sale fuera es que habría que ajustarle otro modelo.

Cuanto mayor sea la serie más próximos a cero estarán los valores de autocorrelación.

PRÁCTICA 3

Los datos de esta serie son concentraciones de un elemento en un proceso químico.

Análisis de series temporales

9

Gráfico horizontal:

El nivel promedio de la serie no es constante, va cambiando. Por lo que sospechamos que la serie no es estacionaria.

No se observan en el gráfico comportamientos estacionales en los que la tendencia cambie.

Las oscilaciones son bastante homogéneas en ninguna destaca su grado de variabilidad.

Análisis de series temporales

10

Función de autocorrelación: Para ver si la serie es o no estacionaria veamos el correlograma. Observamos que decrece lentamente, por lo que podemos decir que no hay estacionariedad (cuando el decrecimiento es más rápido la serie es estacionaria).

Análisis de series temporales

11

Hacemos una diferenciación no estacional:

Aplicamos un modelo en el que hay que diferenciar la serie y obtenemos el gráfico de la serie después de haber hecho una diferenciación no estacional.Se observa que la serie se ha estabilizado.

Si hiciéramos una diferencia más aumentaría la varianza y tendría efectos perjudiciales. No necesitamos hacer más diferenciaciones.

FASE DE IDENTIFICACIÓN

Función de autocorrelación:

Análisis de series temporales

12

En el correlograma estimado con una diferenciación no estacional ya no aparece el decrecimiento.

Los valores que se salen fuera de las bandas son significativamente distintos de cero, pero simplemente por azar un 5% se sale fuera. Si este valor está al principio o corresponde a múltiplos de la estacionalidad debemos sospechar que la serie no se comporta como un ruido blanco, por lo que habrá que expresarlo mediante algunos filtros.

Vemos como corresponde a un modelo de medias móviles de orden uno en que no sabemos si tendrá termino constante.Se trata de un modelo ARIMA(0,1,1).

FASE DE ESTIMACIÓN

Initial: RSS = 21.0841 b = 0.412923 2.04082E-3

Iteration 1: RSS = 20.3571 b = 0.529625 2.71299E-3

Iteration 2: RSS = 20.0166 b = 0.613093 3.16589E-3

Iteration 3: RSS = 19.8971 b = 0.662735 3.35868E-3

Iteration 4: RSS = 19.8661 b = 0.688148 3.41903E-3

Final: RSS = 19.86 ...stopped on criterion 2 --------------------------------------------------------------

Summary of Fitted Model for: CONCENTA.concentrac

--------------------------------------------------------------

Parameter Estimate Stnd.error T-value P-value

MA ( 1) .70014 .05238 13.36639 .00000

MEAN .00344 .00719 .47800 .63319

CONSTANT .00344

--------------------------------------------------------------

Model fitted to differences of order 1

Estimated white noise variance = 0.102371 with 194 degrees of freedom.

Estimated white noise standard deviation (std err) = 0.319955 Chi-square test statistic on first 20 residual autocorrelations = 27.3586 with probability of a larger value given white noise = 0.0725117

Backforecasting: no Number of iterations performed: 5

--------------------------------------------------------------

El p-valor indica que el término constante no es significativo, lo eliminamos y reestimamos el modelo.

REESTIMACIÓN DEL MODELO SIN TERMINO CONSTANTE

Estimation begins.....

Initial: RSS = 21.0883 b = 0.412923

Iteration 1: RSS = 20.3678 b = 0.529182

Iteration 2: RSS = 20.0347 b = 0.611837

Iteration 3: RSS = 19.9203 b = 0.660504

Iteration 4: RSS = 19.8915 b = 0.685138

Final: RSS = 19.886 ...stopped on criterion 2 --------------------------------------------------------------

Summary of Fitted Model for: CONCENTA.concentrac --------------------------------------------------------------

Parameter Estimate Stnd.error T-value P-value

MA ( 1) .69663 .05239 13.29679 .00000

--------------------------------------------------------------

Model fitted to differences of order 1

Estimated white noise variance = 0.10198 with 195 degrees of freedom.

Estimated white noise standard deviation (std err) = 0.319342 Chi-square test statistic on first 20 residual autocorrelations = 27.3978 with probability of a larger value given white noise = 0.0957232

Backforecasting: no Number of iterations performed: 5

--------------------------------------------------------------

FASE DE VALIDACIÓN

Análisis de series temporales

13

Función autocorrelación de los residuos:

Observando el gráfico todos los valores quedan dentro de las bandas, por lo que podemos admitir que los residuos que hemos obtenido se comportan como un ruido blanco.

Análisis de series temporales

14

Predicciones:

Una vez conforme el modelo pasamos a hacer predicciones que se van a ir ajustando a medida que vamos añadiendo datos.

Las predicciones en esta ocasión son constantes ya que el comportamiento es aleatorio.

PRÁCTICA 4

Los datos de esta serie corresponden a número de pasajeros de una compañía aérea internacional.

Análisis de series temporales

15

Gráfico horizontal:

- La serie no tiene un nivel constante, se observa una tendencia creciente.

- Se ve claramente en el gráfico que hay una componente estacional.

- La amplitud de las oscilaciones crece con la tendencia.

Análisis de series temporales

16

Gráfico horizontal de los datos transformados:

Aplicamos el logaritmo a los datos de la serie y vemos que la amplitud de las oscilaciones se ha homogeneizado, es decir suavizamos la varianza de la serie.

Análisis de series temporales

17

Función de autocorrelación:

Observamos un decrecimiento lento. también podemos observar que hay picos periódicos de distancia 12, es decir en los datos 12, 24, 36, etc. Hay una combinación entre comportamientos estacionales y no estacionales. la serie es estacionaria en la componente estacional pero no es estacionaria en la componente no estacional.

Análisis de series temporales

18

Gráfico horizontal con una diferenciación estacional:

Tomamos una diferencia estacional de orden 12 y se ve como el nivel medio de la serie va cambiando.

Análisis de series temporales

19

Función autocorrelación con una diferencia estacional:

En el correlograma aparecen un conjunto de valores al principio que decrecen lentamente.

Viendo el cambio de nivel que se produce en la serie se opta por tomar otra diferencia en la componente no estacional.

Análisis de series temporales

20

Función autocorrelación con una diferencia estacional y otra no estacional:

El nivel medio de la serie se ha estabilizado, es decir, la serie es constante.

Ahora observamos que hay dos valores que se salen (retardo 1 y 12).

Debido a que hemos diferenciado 2 veces habrá que introducir un factor de medias móviles para el comportamiento estacional y otro para el no estacional.

FASE DE ESTIMACIÓN PARTE ESTACIONAL

Primero vamos a estimar el modelo para la parte estacional(los múltiplos de 12). Es un modelo MA(1)12

Estimation begins.....

Initial: RSS = 0.254248 b = 0.1 2.9088E-4

Iteration 1: RSS = 0.218608 b = 0.37616 3.97224E-4

Iteration 2: RSS = 0.206337 b = 0.578442 2.41882E-4

Iteration 3: RSS = 0.205945 b = 0.615052 1.63527E-4

Final: RSS = 0.205944 ...stopped on criterion 2

--------------------------------------------------------------

Summary of Fitted Model for: log(PASAJERO.pasajero) --------------------------------------------------------------

Parameter Estimate Stnd.error T-value P-value

SMA( 12) .61312 .07524 8.14929 .00000

MEAN .00013 .00154 .08542 .93206

CONSTANT .00013

--------------------------------------------------------------

Model fitted to differences of order 1

Model fitted to seasonal differences of order 1 with seasonal length = 12

Estimated white noise variance = 1.59646E-3 with 129 degrees of freedom.

Estimated white noise standard deviation (std err) = 0.0399558 Chi-square test statistic on first 20 residual autocorrelations = 30.504 with probability of a larger value given white noise = 0.0328252

Backforecasting: no Number of iterations performed: 4

En la función de autocorrelación parcial se observa un gráfico parecido al de la función de autocorrelación. Cuando el correlograma se corta, el orden es donde se corta. Identificamos 0 1 0 no estacional y 0 1 1 estacional. Estimamos el modelo con el objetivo de analizar los residuos.

Estimation begins.....

Initial: RSS = 0.22257 b = 0.341124 0.1

Iteration 1: RSS = 0.189643 b = 0.378148 0.384419

Iteration 2: RSS = 0.18197 b = 0.386375 0.561205

Final: RSS = 0.181929 ...stopped on criterion 2

--------------------------------------------------------------

Summary of Fitted Model for: log(PASAJERO.pasajero) --------------------------------------------------------------

Parameter Estimate Stnd.error T-value P-value

MA ( 1) .38071 .08103 4.69821 .00001

SMA( 12) .57161 .07865 7.26747 .00000

--------------------------------------------------------------

Model fitted to differences of order 1

Model fitted to seasonal differences of order 1 with seasonal length = 12. Estimated white noise variance = 1.4103E-3 with 129 degrees of freedom. Estimated white noise standard deviation (std err) = 0.0375539 Chi-square test statistic on first 20 residual autocorrelations = 13.5216 with probability of a larger value given white noise = 0.759702

Backforecasting: no Number of iterations performed: 3

El modelo definitivo que identificamos se rehace sumando los órdenes y obtenemos un modelo SARIMA(0,1,1)*(0,1,1)12.

En el modelo la media no es significativa, por lo que la hemos eliminado y reestimado el modelo.

Análisis de series temporales

21

Función autocorrelación:

La función de autocorrelación tiene el retardo 23 fuera de las bandas, pero eso no es significativo ya que no corresponde a un múltiplo de la estacionalidad y además simplemente por azar es esperable que se salgan hasta 3. Se corresponde con el correlograma de un ruido blanco.

Análisis de series temporales

22

Función autocorrelación parcial:

Vemos que en la función de autocorrelación parcial se escapa el retardo 59, que como en el caso anterior tampoco es significativo.

Por todo lo visto anteriormente podemos decir que el modelo ajustado es valido.

Análisis de series temporales

23

Papel probabilístico normal de los residuos:

Para ver si los datos tienen distribución normal obtenemos este gráfico del papel probabilístico normal de los residuos, en el vemos que se ajusta bastante bien a una distribución normal.

Análisis de series temporales

24

Gráfico de predicciones:

En el gráfico de las predicciones vemos las predicciones para los siguientes 24 valores de la serie, podemos observar como se hace una réplica bastante buena de la variación estacional.

Análisis de Series Temporales Prácticas

Licenciatura en Ciencias y Técnicas Estadísticas -4-




Descargar
Enviado por:Esteban Rodríguez
Idioma: castellano
País: España

Te va a interesar