Monday, 6 November 2017

Arima Moving Average


Un RIMA significa autorregresivos integrados en movimiento modelos Promedio. Univariado (solo vector) ARIMA es una técnica de predicción que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su principal aplicación es en el área de predicción a corto plazo que requiere un mínimo de 40 puntos de datos históricos. Funciona mejor cuando sus datos exhibe un patrón estable o constante en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de que los autores originales), ARIMA es generalmente superior a técnicas de suavizado exponencial cuando los datos son razonablemente largo y la correlación entre las observaciones anteriores es estable. Si los datos son de corto o muy volátiles, y luego algún método de alisado puede funcionar mejor. Si usted no tiene al menos 38 puntos de datos, se debe considerar otro método que no ARIMA. El primer paso en la aplicación de la metodología ARIMA es para comprobar si hay estacionariedad. Estacionariedad implica que la serie se mantiene en un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, a continuación, sus datos no es estacionaria. Los datos también debe mostrar una varianza constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y crece a un ritmo más rápido. En tal caso, las subidas y bajadas en la estacionalidad se harán más dramática en el tiempo. Sin estas condiciones de estacionariedad se cumplen, muchos de los cálculos asociados con el proceso no se puede calcular. Si una representación gráfica de los datos indica no estacionariedad, entonces debería diferencia de la serie. La diferenciación es una excelente manera de transformar una serie no estacionaria a uno estacionario. Esto se realiza restando la observación en el periodo actual de la anterior. Si esta transformación se realiza sólo una vez para una serie, se dice que los datos han sido primera diferenciados. Este proceso elimina esencialmente la tendencia si la serie está creciendo a un ritmo bastante constante. Si está creciendo a un ritmo creciente, se puede aplicar el mismo procedimiento y la diferencia de los datos de nuevo. Sus datos serían entonces segundo diferenciada. Autocorrelaciones son valores numéricos que indican cómo una serie de datos está relacionado con sí mismo en el tiempo. Más precisamente, se mide la fuerza con los valores de datos en un número especificado de periodos aparte se correlacionan entre sí en el tiempo. El número de períodos separados generalmente se llama el retraso. Por ejemplo, una autocorrelación en medidas de retardo 1 cómo valora 1 periodo aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso de 2 medidas de cómo los datos de dos períodos separados están correlacionadas en toda la serie. Autocorrelaciones pueden variar 1--1. Un valor cercano a 1 indica una correlación positiva alta, mientras que un valor cercano a -1 indica una correlación negativa alta. Estas medidas son más a menudo evaluados a través de representaciones gráficas llamadas correlagrams. Un correlagram representa los valores de autocorrelación para una serie dada en diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. metodología ARIMA intenta describir los movimientos de una serie de tiempo estacionaria en función de lo que se denomina autorregresivo y moviendo parámetros medios. Estos se conocen como parámetros AR (autoregessive) y los parámetros MA (promedios móviles). Un modelo AR con sólo 1 de parámetros se puede escribir como. X (t) Un (1) X (t-1) E (t) en la que X (t) de series de tiempo bajo investigación Un (1) el parámetro autorregresivo de orden 1 X (t-1) las series de tiempo se retrasó 1 periodo E (t) el término de error del modelo Esto simplemente significa que cualquier valor dado de X (t) puede explicarse por alguna función de su valor anterior, X (t-1), además de algunos errores aleatorios inexplicable, E (t). Si el valor estimado de A (1) fue 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionado con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), además de algunos al azar de error e (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Mover Modelos Promedio: Un segundo tipo de modelo de Box-Jenkins se llama un modelo de media móvil. Aunque estos modelos son muy similares al modelo AR, el concepto detrás de ellos es muy diferente. Móviles parámetros medios relacionan lo que ocurre en el período t sólo a los errores aleatorios que ocurrieron en periodos pasados, es decir, E (t-1), E (t-2), etc en lugar de X (t-1), X ( t-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA se puede escribir de la siguiente manera. X (t) - B (1) E (t-1) E (t) El término B (1) se llama un MA de orden 1. El signo negativo delante del parámetro se utiliza para la única convención y por lo general se imprime a cabo automáticamente por la mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente con el error aleatorio en el periodo anterior, E (t-1), y con el término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil se pueden extender a estructuras de orden superior que cubren diferentes combinaciones y en movimiento longitudes medias. metodología ARIMA también permite que los modelos que se construirán que incorporan tanto autorregresivo y moviendo parámetros medios juntos. Estos modelos se conocen como modelos mixtos a menudo. Aunque esto lo convierte en una herramienta de pronóstico más complicado, de hecho, la estructura puede simular la serie mejor y producir un pronóstico más exacto. modelos puros implican que la estructura se compone sólo de los parámetros AR o MA - no ambas. Los modelos desarrollados por este enfoque generalmente se llaman los modelos ARIMA, ya que utilizan una combinación de autorregresivo (AR), la integración (I) - refiriéndose al proceso de diferenciación inversa para producir el pronóstico, y moviendo las operaciones promedio (MA). Un modelo ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (P), el número de operadores de diferenciación (d), y el más alto orden del plazo de media móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo de segundo orden autorregresivo de primer orden con un componente promedio cuya serie se ha diferenciado una vez para inducir estacionariedad en movimiento. Recogiendo la Especificación de la derecha: El principal problema en la clásica Box-Jenkins está tratando de decidir qué especificación ARIMA utilizar - i. e. cuántos parámetros AR y / o MA que incluyen. Esto es lo que gran parte de la caja-Jenkings 1976 se dedicó al proceso de identificación. Dependía de gráfica y numérica eva - luación de la autocorrelación de la muestra y las funciones de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en la complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, los datos representan solamente una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, error de medición, etc.) pueden distorsionar el proceso de identificación teórica. Es por ello que la modelización ARIMA tradicional es más un arte que una science.8.4 Moving modelos de promedio En lugar de utilizar los valores pasados ​​de la variable de pronóstico en una regresión, un modelo de media móvil utiliza los errores de predicción pasados ​​en un modelo de regresión similar. y c et theta theta correo electrónico puntos theta e, donde et es ruido blanco. Nos referimos a esto como un modelo MA (q). Por supuesto, no se observan los valores de y, por lo que no es realmente una regresión en el sentido habitual. Observe que cada valor de yt se puede considerar como un promedio móvil ponderado de los últimos errores de pronóstico. Sin embargo, se mueve modelos de promedio no debe confundirse con el movimiento suavizado promedio discutimos en el capítulo 6. Un modelo de media móvil se utiliza para la predicción de valores futuros mientras se mueve suavizado promedio se utiliza para estimar la tendencia-ciclo de los valores del pasado. Figura 8.6: Dos ejemplos de modelos de datos por el movimiento promedio con diferentes parámetros. Izquierda: MA (1) con y 20e t t t 0.8e-1. Derecha: MA (2) con y t e t - e t-1 0.8e t-2. En ambos casos, e t tiene una distribución normal de ruido blanco con media cero y varianza uno. La Figura 8.6 muestra algunos datos de un MA (1) y un modelo (2) Modelo MA. El cambio de los parámetros theta1, puntos, thetaq resultados en diferentes patrones de series de tiempo. Al igual que con los modelos autorregresivos, la varianza del término de error y sólo cambiará la escala de la serie, no los patrones. Es posible escribir cualquier modelo estacionario AR (p) como modelo MA (infty). Por ejemplo, mediante la sustitución repetida, podemos demostrar esto para un AR (1) Modelo: comenzar yt amp amp phi1y et phi1 (phi1y e) et amp phi12y phi1 E et amp phi13y phi12e phi1 E et amptext extremo provisto -1 lt lt phi1 1, el valor de phi1k a disminuir, al k se hace más grande. Por lo que finalmente obtenemos yt et phi1 correos electrónicos phi12 phi13 e cdots, un proceso MA (infty). El resultado inverso se mantiene si imponemos algunas restricciones sobre los parámetros MA. A continuación, el modelo se llama MA invertible. Es decir, que podemos escribir cualquier proceso invertible MA (q) como un proceso AR (infty). invertibles modelos no son simplemente nos permiten convertir de modelos MA a AR modelos. También tienen algunas propiedades matemáticas que hacen más fácil su uso en la práctica. Las limitaciones invertibilidad son similares a las limitaciones de estacionariedad. Para un MA (1) Modelo: -1lttheta1lt1. Para un MA (2) Modelo: -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. Las condiciones más complicadas son válidas para qge3. Una vez más, R se hará cargo de estas limitaciones cuando se estima el models. Linear frente de mínimos cuadrados no lineales modelos ARIMA que incluyen sólo los términos AR son casos especiales de modelos de regresión lineal, por lo que pueden ser colocados por mínimos cuadrados ordinarios. pronósticos AR son una función lineal de los coeficientes, así como una función lineal de los datos del pasado. En principio, las estimaciones de mínimos cuadrados de los coeficientes AR se pueden calcular exactamente de autocorrelaciones en un solo quotiterationquot. En la práctica, se puede incorporar un modelo AR en el procedimiento de Regresión Múltiple - acaba de regresar DIFF (Y) (o lo que sea) de retardos de sí mismo. (Sin embargo, se obtendría resultados ligeramente diferentes desde el procedimiento ARIMA - ver abajo) que incluyen los modelos ARIMA términos MA son similares a los modelos de regresión, pero no puedo estar equipados por mínimos cuadrados ordinarios: Los pronósticos son una función lineal de los datos del pasado, sino que está funciones no lineales de coeficientes - por ejemplo, un modelo ARIMA (0,1,1) sin constante es una media móvil ponderado exponencialmente: en la que los pronósticos son una función no lineal de la (1) parámetro MA (quotthetaquot). Otra forma de ver el problema: usted no puede ajustar modelos de regresión múltiple utilizando MA ordinario, porque theres ninguna manera de especificar ERRORES como una variable independiente - no se conocen los errores hasta que el modelo está equipado Necesitan ser calculado de forma secuencial. periodo a periodo, teniendo en cuenta las estimaciones de los parámetros actuales. Por lo tanto, los modelos MA requieren un algoritmo de estimación no lineal que se utiliza, similar al algoritmo quotSolverquot en Excel. El algoritmo utiliza un proceso de búsqueda que normalmente requiere de 5 a 10 iteraciones y, ocasionalmente, pueden no converger. Puede ajustar las tolerancias para determinar los tamaños de paso y parada criterios de búsqueda (aunque los valores por defecto son por lo general OK). quotMeanquot frente quotconstantquot El quotmeanquot y la quotconstantquot en Arima resultados de ajuste de modelo son diferentes números cada vez que el modelo incluye términos AR. Supongamos que se encaja un modelo ARIMA a Y en la que p es el número de términos autorregresivos. (Se supone por conveniencia que no existen términos MA.) Sea Y la versión diferenciada (stationarized) de Y., por ejemplo, y t Y t - Y t-1 si se ha utilizado una diferencia no estacional. Entonces la ecuación de predicción AR (p) para Y es: Esto es sólo un modelo de regresión múltiple ordinario en el que 956 es el término constante, 981 1 es el coeficiente de la primera lag de y. y así. Ahora, a nivel interno, el software convierte esta forma pendiente-intersección de la ecuación de regresión a una forma equivalente en términos de desviaciones de la media. Sea m denota la media de la serie stationarized y. Entonces la ecuación autorregresiva p-orden puede ser escrita en términos de desviaciones de la media como: Mediante la recopilación de todos los términos constantes en esta ecuación, vemos que es equivalente a la forma original de la ecuación si: x media constante (1 - suma de coeficientes AR) el software de realidad estima m (junto con los otros parámetros del modelo) y los informes de esta como la media de los resultados-modelo apropiado, junto con su error estándar y t-estadística, etc. a continuación se calcula la constante (956) de acuerdo con la fórmula anterior. Si el modelo no contiene ningún término AR, la media y la constante son idénticos. En un modelo con un orden de diferenciación no estacional (sólo), la media es el factor de tendencia (promedio de cambio de un período a otro). En un modelo con un orden de diferenciación estacional (solamente), la media es el factor de tendencia anual (promedio de la variación de año a año). El problema básico: un modelo ARIMA (o de otro modelo de serie temporal) predice valores futuros de la serie temporal de valores pasados ​​- pero ¿cómo deberían la ecuación de predicción pueden inicializar para hacer un pronóstico para la primera observación (En realidad, los modelos AR pueden ser inicializado al dejar caer las primeras observaciones - aunque esto es ineficiente y desechos Data-- pero los modelos MA requiere una estimación de un error previo antes de que puedan hacer que el primer pronóstico) extraño pero cierto.. una serie de tiempo estacionaria tiene el mismo aspecto que va hacia adelante o hacia atrás en el tiempo, por lo tanto. El mismo modelo que predice el futuro de una serie también se puede usar para predecir su pasado. La solución: para exprimir al máximo la información de los datos disponibles, la mejor manera de inicializar un modelo ARIMA (o cualquier modelo de predicción de series de tiempo) es utilizar la predicción hacia atrás (quotbackforecastingquot) para obtener estimaciones de valores de datos antes del período 1. Cuando se utiliza la opción backforecasting en la estimación ARIMA, el algoritmo de búsqueda en realidad hace dos pasadas por los datos en cada iteración: en primer lugar un pase hacia atrás se hizo para estimar valores de los datos anteriores usando las estimaciones de los parámetros actuales, entonces los valores de los datos anteriores estimados se utilizan para inicializar la ecuación de predicción para un pase a través de los datos. Si usted no utiliza la opción backforecasting, la ecuación de predicción es inicializado por el supuesto de que los valores anteriores de la serie stationarized eran iguales a la media. Si usted hace uso de la opción backforecasting, a continuación, los backforecasts que se utilizan para inicializar el modelo son parámetros implícitos del modelo, que deben ser estimados junto con los coeficientes AR y MA. El número de parámetros implícitos adicionales es aproximadamente igual a la mayor retraso en el modelo - por lo general 2 o 3 para un modelo no estacional, y S1 o 2s1 para un modelo de temporada con seasonalitys. (Si el modelo incluye tanto una diferencia de temporada y una temporada AR o MA plazo, se necesita dos temporadas por valor de los valores previos a la puesta en marcha) Tenga en cuenta que con cualquiera de las opciones backforecasting, un modelo AR se calcula de manera diferente de lo que se estima en el procedimiento de regresión múltiple (los valores que faltan no son simplemente ignorados - que se sustituyen o bien con una estimación de la media o con backforecasts), por lo tanto, un modelo AR equipado en el procedimiento ARIMA nunca cederá exactamente los mismos parámetros estimados como un modelo AR equipado en el procedimiento de regresión múltiple. La sabiduría convencional: convertir backforecasting OFF cuando no está seguro de si el modelo actual es válida, enciéndala para obtener estimaciones de los parámetros finales, una vez estás razonablemente seguro de que el modelo es válido. Si el modelo es mis-especificados, backforecasting puede conducir a fallos de los parámetros estimados a converger y / o de raíz unitaria problems. Autoregressive integrados de media móvil ARIMA (p, d, q) los modelos de análisis de series temporales Por Michael Moore-Salas el 15 de septiembre de 2015, de la anterior serie de artículos (Partes 1. 2 y 3) entramos en detalle significativo acerca de la AR (p), MA (q) y ARMA (p, q) modelos de series temporales lineales. Se han utilizado estos modelos para generar conjuntos de datos simulados, modelos ajustados para recuperar parámetros y después se aplican estos modelos a los datos financieros de renta variable. En este artículo vamos a discutir una extensión del modelo ARMA, es decir, el modelo autorregresivo integrado de media en movimiento, o (p, d, q) modelo ARIMA. Veremos que es necesario tener en cuenta el modelo ARIMA cuando tenemos series no estacionarias. Tales series se producen en presencia de tendencias estocásticas. Recapitulación rápida y próximos pasos Hasta la fecha hemos tenido en cuenta los siguientes modelos (los enlaces le llevarán a los artículos correspondientes): Hemos construido de manera constante hasta nuestra comprensión de series de tiempo con conceptos tales como la serie de correlación, estacionariedad, linealidad, residuos, correlograms, la simulación, montaje, estacionalidad, heterocedasticidad condicional y la prueba de hipótesis. Hasta el momento no hemos realizado ninguna predicción o previsión de nuestros modelos y por lo tanto no hemos tenido ningún mecanismo para producir un sistema de comercio o la curva de las acciones. Una vez que hemos estudiado ARIMA (en este artículo), ARCH y GARCH (en los próximos artículos), que estarán en condiciones de construir una estrategia comercial básica a largo plazo basada en la predicción de los rendimientos del índice del mercado de valores. A pesar de que he entrado en muchos detalles acerca de los modelos que sabemos que en última instancia no tiene un gran rendimiento (AR, MA, ARMA), ahora estamos bien versados ​​en el proceso de modelado de series temporales. Esto significa que cuando venimos a estudiar los modelos más recientes (e incluso las actualmente en la literatura de investigación), tendremos una importante base de conocimientos en la que basarse, con el fin de evaluar de manera efectiva estos modelos, en lugar de tratarlos como una llave en mano prescripción o cuadro negro. Más importante aún, nos dará la confianza para ampliar y modificar por nosotros mismos y entender lo que estamos haciendo cuando lo hacemos Id como para darle las gracias por ser paciente hasta el momento, ya que podría parecer que estos artículos están muy lejos de la acción real de operaciones reales. Sin embargo, la investigación de intercambio verdadera cuantitativa es cuidadoso, medida y toma mucho tiempo para hacerlo bien. No hay una solución rápida o esquema para hacerse rico en el comercio cuant. Eran casi listo para considerar nuestro primer modelo de comercio, que será una mezcla de Arima y GARCH, por lo que es imperativo que pasar algún tiempo entender el modelo ARIMA así Una vez que hemos construido nuestro primer modelo de comercio, vamos a considerar más modelos avanzados tales como los procesos de memoria larga, modelos de espacio de estado (es decir, el filtro de Kalman) y los modelos de vectores autorregresivos (VAR), que nos llevarán a otras estrategias de negociación, más sofisticados,. Autorregresivos integrados de media móvil (ARIMA) Modelos de orden p, d, q modelos Justificación ARIMA se utilizan porque pueden reducir una serie no estacionaria a una serie estacionaria usando una secuencia de pasos de diferenciación. Podemos recordar del artículo sobre el ruido blanco y al azar paseos que si aplicamos el operador de diferencia a una serie de paseo aleatorio (una serie no estacionaria) nos quedamos con ruido blanco (una serie estacionaria): comienzan xt nabla xt - x peso final ARIMA realiza esencialmente esta función, pero lo hace en varias ocasiones, d veces, con el fin de reducir una serie no estacionaria a uno estacionario. Con el fin de manejar otras formas de no estacionariedad allá de tendencias estocásticas modelos adicionales se pueden utilizar. efectos de la estacionalidad (tales como los que ocurren en precios de los productos) pueden ser abordados con el modelo estacional ARIMA (SARIMA), sin embargo nos volveremos a discutir SARIMA mucho en esta serie. heterocedásticos efectos condicionales (como con el agrupamiento de la volatilidad en acciones índices) se pueden abordar con ARCH / GARCH. En este artículo vamos a considerar series no estacionarias con las tendencias estocásticos y modelos ARIMA ajuste a estas series. Nosotros también, finalmente, generar predicciones para nuestra serie financiera. Definiciones Antes de la definición de procesos ARIMA pasamos a desarrollar el concepto de una serie integrada: Serie integrada de orden d Una serie de tiempo es integrada de orden d. I (d), si: comenzar final en peso xt nablad Es decir, si nos diferencia de los tiempos de la serie D que reciben una serie discreta de ruido blanco. De forma alternativa, usando el operador de desplazamiento hacia atrás una condición equivalente es: Ahora que hemos definido una serie integrada podemos definir el proceso ARIMA sí: autorregresivo integrado de media móvil Modelo de orden p, d, q Una serie temporal es una autorregresivo integrado modelo de media móvil de orden p, d, q. ARIMA (p, d, q). si xt es un nablad autorregresivo media de orden p, q, ARMA (p, q) en movimiento. Es decir, si la serie es diferenciados d veces, y a continuación, sigue un proceso ARMA (p, q), entonces es un (p, d, q) serie ARIMA. Si usamos la notación polinómica de la Parte 1 y la Parte 2 de la serie ARMA, a continuación, un (p, d, q) proceso ARIMA pueden escribirse en términos del operador de desplazamiento hacia atrás. : ¿Dónde peso es una serie discreta de ruido blanco. Hay algunos puntos a tener en cuenta sobre estas definiciones. Dado que el paseo aleatorio está dada por x xt en peso se puede ver que (1) es otra representación, ya nabla1 xt en peso. Si sospechamos una tendencia no lineal, entonces podríamos ser capaces de utilizar diferenciación repetida (es decir, d gt 1) para reducir una serie de ruido blanco estacionario. En R podemos utilizar el comando diff con parámetros adicionales, por ejemplo, diff (x, d3) para llevar a cabo las diferencias repetidas. Simulación, Correlograma y modelo de montaje Dado que ya hemos hecho uso del comando arima. sim para simular un (p, q) proceso ARMA, el siguiente procedimiento será similar al llevado a cabo en la parte 3 de la serie ARMA. La principal diferencia es que ahora vamos a configurar d1, es decir, vamos a producir una serie de tiempo no estacionarias con un componente estocástico de tendencia. Al igual que antes vamos a adaptarse a un modelo ARIMA con nuestros datos simulados, intentará recuperar los parámetros, crear intervalos de confianza para estos parámetros, producir un correlogram de los residuos del modelo ajustado y, finalmente, llevar a cabo una prueba de Ljung-Box para establecer si tenemos un buen ajuste. Vamos a simular un modelo ARIMA (1,1,1), con el coeficiente autorregresivo alpha0.6 y el movimiento promedio de coeficiente beta-0,5. Aquí está el código R para simular y representar gráficamente una serie como: Ahora que tenemos nuestra serie simulada vamos a tratar de ajustar un modelo ARIMA (1,1,1) modelo a la misma. Ya que sabemos que el orden simplemente nos especificarlo en el ajuste: Los intervalos de confianza se calculan como: Ambas estimaciones de los parámetros están dentro de los intervalos de confianza y están cerca de los verdaderos valores de los parámetros de la serie ARIMA simulado. Por lo tanto, no deberíamos sorprendernos de ver los residuales que parece una realización de ruido blanco discreta: Por último, podemos realizar una prueba de Ljung-Box para proporcionar evidencia estadística de un buen ajuste: Podemos ver que el p-valor es significativamente mayor que 0,05 y, como tal, se puede afirmar que existe una fuerte evidencia de ruido blanco discreta ser un buen ajuste a los residuos. Por lo tanto, el modelo ARIMA (1,1,1) modelo es una buena opción, como se esperaba. Los datos financieros y de predicción en esta sección vamos a ajustar los modelos ARIMA a Amazon, Inc. (AMZN) y el Índice de SampP500 US Equity (GPSC, en Yahoo Finanzas). Haremos uso de la biblioteca de previsión, escrito por Rob J Hyndman. Vamos a seguir adelante e instalar la biblioteca en R: Ahora podemos usar quantmod para descargar la serie de precios diarios del Amazonas desde el comienzo de 2013. Dado que ya se han dado los primeros Diferencias en el orden de la serie, el ARIMA fit llevado a cabo en breve no requiere d gt 0 para el componente integrado: al igual que en la parte 3 de la serie ARMA, ahora vamos a recorrer las combinaciones de p, d, q, para encontrar el modelo óptimo ARIMA (p, d, q). Por óptima nos referimos a la combinación para que minimiza el Criterio de Información de Akaike (AIC): Podemos ver que una orden de p4, d0, se seleccionó Q4. Notablemente d0, como ya hemos tenido diferencias de primer orden anterior: Si dibujamos la correlogram de los residuos que podemos ver si tenemos pruebas de una serie discreta de ruido blanco: Hay dos picos significativos, es decir, a k15 y k21, a pesar de que debe esperar ver picos estadísticamente significativas simplemente debido a la variación de la muestra 5 de las veces. Vamos a realizar una prueba de Ljung-Box (ver artículo anterior) y ver si tenemos pruebas para un buen ajuste: Como podemos ver, el valor de p es mayor que 0,05 y por eso tenemos pruebas para un buen ajuste en el nivel 95. Ahora podemos usar el comando de previsión de la biblioteca de previsión con el fin de predecir 25 días más tarde para la serie de retornos de Amazon: Podemos ver las predicciones puntuales durante los próximos 25 días con 99 (azul claro) bandas de error 95 (azul oscuro) y . Vamos a utilizar estas previsiones en nuestra estrategia de negociación de la serie primera vez cuando llegamos a combinar ARIMA y GARCH. Vamos a llevar a cabo el mismo procedimiento para la SampP500. En primer lugar se obtienen los datos de quantmod y convertirlo en un registro diario retornos de flujo: Nos ajustamos un modelo ARIMA haciendo un bucle sobre los valores de p, d y q: La AIC nos dice que el mejor modelo es el ARIMA (2,0, 1) modelo. Notar una vez más que D0, como ya hemos tenido diferencias de primer orden de la serie: Podemos trazar los residuos del modelo ajustado para ver si tenemos pruebas de ruido blanco discreta: El correlogram parece prometedor, por lo que el siguiente paso es ejecutar Ljung-Box y confirman que tenemos un buen ajuste del modelo: Puesto que el p-valor es mayor que 0,05 que tienen evidencia de un buen ajuste del modelo. Por qué es que en el artículo anterior nuestro test de Ljung-Box para el SampP500 mostró que el ARMA (3,3) era un mal ajuste de los rendimientos diarios de registro Observe que me truncada deliberadamente los datos SampP500 para comenzar a partir de 2013 en este artículo , que convenientemente excluye los periodos de volatilidad en torno a 2007-2008. Por lo tanto, hemos excluido una gran parte de los SampP500 en los que tuvimos agrupamiento de la volatilidad excesiva. Esto afecta la correlación serial de la serie y por lo tanto tiene el efecto de hacer que la serie estacionaria parecen más de lo que ha sido en el pasado. Este es un punto muy importante. Al analizar las series temporales que tenemos que tener mucho cuidado de las series condicionalmente heterocedástico, tales como índices de la bolsa. En las finanzas cuantitativas, se trata de determinar los períodos de diferente volatilidad a menudo se conoce como detección de régimen. Es una de las tareas más difíciles de lograr Bueno discutir este punto en detalle en el próximo artículo, cuando llegamos a considerar los modelos ARCH y GARCH. Permite ahora trazar un pronóstico para los próximos 25 días a partir de las declaraciones de SampP500 registro diario: Ahora que tenemos la capacidad para adaptarse y modelos de pronóstico, tales como ARIMA, estaban muy cerca de ser capaz de crear indicadores de la estrategia para el comercio. Los próximos pasos en el siguiente artículo vamos a echar un vistazo a el modelo generalizado condicional autorregresiva Heteroscedasticidad (GARCH) y utilizarlo para explicar más de la correlación serial en ciertas acciones y series de índices de equidad. Una vez que hemos discutido GARCH estaremos en condiciones de combinarlo con el modelo ARIMA y crear indicadores de señal y por lo tanto una estrategia básica de comercio cuantitativo. Michael Salas-Moore Mike es el fundador de QuantStart y ha estado involucrado en la industria de las finanzas cuantitativas en los últimos cinco años, principalmente como un desarrollador quant y luego como consultora comerciante cuant para los fondos de cobertura. Articles2.1 relacionados Moving Modelos Promedio (modelos MA) modelos de series temporales conocidos como modelos ARIMA puede incluir términos autorregresivos y / o términos de medias móviles. En la Semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor rezagado de x t. Por ejemplo, un retraso de 1 x término autorregresivo es t-1 (multiplicado por un coeficiente). Esta lección define términos de medias móviles. Un término promedio móvil en un modelo de series de tiempo es un error pasado (multiplicado por un coeficiente). Sea (en peso desbordado N (0, sigma2w)), lo que significa que el w t son de forma idéntica, distribuido de forma independiente, cada uno con una distribución normal con media 0 y la misma varianza. El 1º orden moviendo modelo de media, denotado por MA (1) es (xt theta1w mu peso) El orden 2º movimiento modelo de media, denotado por MA (2) es (mu xt peso theta1w theta2w) El q º orden moviendo modelo de media , denotado por MA (q) es (mu xt wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque no voltear los signos algebraicos de valores de los coeficientes estimados y los términos (unsquared) en las fórmulas para FCA y varianzas. Es necesario comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza señales positivas en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie de tiempo con un MA (1) Nota Modelo que el único valor distinto de cero en el ACF teórico es de retardo 1. Todos los demás autocorrelaciones son 0. Así, un ACF muestra con una autocorrelación significativa sólo en el retardo 1 es un indicador de un posible MA (1) modelo. Para los estudiantes interesados, pruebas de estas propiedades son un apéndice de este folleto. Ejemplo 1 Supongamos que un MA (1) modelo es x t 10 w w t 0,7 t-1. donde (en peso desbordado N (0,1)). Por lo tanto el coeficiente 1 0.7. El ACF teórico está dado por una trama de esta sigue ACF. La trama se acaba de mostrar es la ACF teórico para un MA (1) con 1 0.7. En la práctica, una muestra de costumbre suelen proporcionar un patrón tan claro. El uso de R, simulamos n 100 valores de las muestras utilizando el modelo x 10 w t t t 0,7 W-1 donde w t iid N (0,1). Para esta simulación, un gráfico de series temporales de datos de la muestra de la siguiente manera. No podemos decir mucho de esta trama. El ACF de la muestra para la simulación de datos sigue. Vemos un aumento en el retardo 1 seguido por valores generalmente no significativos para retardos pasado 1. Tenga en cuenta que la muestra ACF no coincide con el patrón teórico de la MA subyacente (1), que es que todas las autocorrelaciones para los retrasos del pasado 1 estarán 0 . una muestra tendría un ACF muestra ligeramente diferente se muestra a continuación, pero probablemente tendría las mismas características generales. Theroretical Propiedades de una serie temporal con un modelo MA (2) Para el (2) Modelo MA, propiedades teóricas son las siguientes: Tenga en cuenta que los únicos valores no nulos en la ACF teórica son los GAL 1 y 2. Autocorrelaciones para retardos más altos son 0 . por lo tanto, una muestra con ACF autocorrelaciones significativas en los retardos 1 y 2, pero autocorrelaciones no significativos para retardos más alto indica una posible MA (2) del modelo. iid N (0,1). Los coeficientes son 1 0,5 y 2 0.3. Debido a que este es un MA (2), el ACF teórica tendrá valores distintos de cero solamente en los retardos 1 y 2. Los valores de los dos autocorrelaciones son distintos de cero Una trama de la ACF teórico sigue. Como casi siempre es el caso, datos de la muestra suele comportarse tan perfectamente como teoría. Hemos simulado n 150 valores de la muestra para el modelo x 10 w t t t-0,5 W 0,3 W 1 T-2. donde w t iid N (0,1). El gráfico de series temporales de datos de la siguiente manera. Al igual que con el gráfico de series temporales de los (1) datos de las muestras MA, usted no puede decir mucho de ella. El ACF de la muestra para la simulación de datos sigue. El patrón es típico para situaciones en las que una (2) modelo de MA puede ser útil. Hay dos picos estadísticamente significativas en los retardos 1 y 2, seguido por los valores no significativos para otros retardos. Tenga en cuenta que debido a un error de muestreo, el ACF muestra no coincide con el patrón teórico exactamente. ACF para el general MA (q) Modelos Una característica de los modelos MA (q), en general, es que hay autocorrelaciones distintos de cero para los primeros retardos q autocorrelaciones y 0 para todos los GAL gt q. No unicidad de la conexión entre los valores de 1 y (Rho1) en MA (1) Modelo. En el MA (1) modelo, para cualquier valor de 1. el recíproco 1/1 da el mismo valor para A modo de ejemplo, utilizar 0,5 por 1. y luego usar 1 / (0,5) 2 por 1. Usted conseguirá (Rho1) 0,4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. que restringir MA (1) modelos de tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 habrá un valor de parámetro permisible, mientras que 1 1 / 0.5 2 no lo hará. Invertibilidad de modelos Un modelo MA MA se dice que es invertible si es algebraicamente equivalente a un modelo AR orden infinito convergentes. Al converger, nos referimos a que los coeficientes AR disminuyen a 0 a medida que avanzamos en el tiempo. Invertibilidad es una restricción de software programado en series de tiempo utilizado para estimar los coeficientes de los modelos con los términos MA. No es algo que comprobamos en el análisis de datos. Información adicional acerca de la restricción invertibilidad de MA (1) modelos se da en el apéndice. Teoría avanzada Nota. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - Q y q 0 tiene soluciones para y que están fuera del círculo unitario. R Código de los ejemplos en el Ejemplo 1, que representa el ACF teórica del modelo x 10 w t t. 7w t-1. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizan para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0,7), lag. max10) 10 rezagos de ACF para MA (1) con 0,7 theta1 lags0: 10 crea una variable llamada desfases que va de 0 a 10. parcela (retardos, acfma1, xlimc (1,10), ylabr, Type H, principal ACF para MA (1) con theta1 0,7) abline (H0) agrega un eje horizontal de la gráfica el primer comando determina la ACF y lo almacena en un objeto acfma1 llamado (nuestra elección del nombre). El comando plot (los comandos 3º) parcelas se retrasa en comparación con los valores de ACF para desfases del 1 al 10. Cuando las etiquetas El parámetro ylab el eje Y y el parámetro principal pone un título en la parcela. Para ver los valores numéricos de la ACF sólo tiene que utilizar el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. xcarima. sim (n150, lista (mac (0,7))) Simula n 150 valores de MA (1) xxc10 añade 10 para hacer medias por defecto 10. Simulación en el sentido de 0. plot (x, TypeB, mainSimulated MA (1) datos) ACF (x, xlimc (1,10), mainACF para datos de muestras simuladas) En el Ejemplo 2, se representa gráficamente la ACF teórica del modelo XT 10 en peso de 0,5 w t-1 0,3 w T-2. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 parcela (GAL, acfma2, xlimc (1,10), ylabr, Type H, principal ACF para MA (2) con theta1 0,5, theta20.3) abline (H0) xcarima. sim (n150, lista (mac (0,5, 0,3))) xxc10 plot (x, TypeB, principal simulada MA (2) Serie) ACF (x, xlimc (1,10), mainACF para MA simulada (2) datos) Apéndice: Prueba de propiedades de MA (1) para los estudiantes interesados, aquí están las pruebas de las propiedades teóricas de la (1) modelo MA. Diferencia: (texto (xt) w texto (mu theta1 en peso) 0 texto (en peso) de texto (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Cuando h 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 . la razón es que, por definición de independencia del peso. E (k w w j) 0 para cualquier k j. Además, como la w t tiene media 0, E (w w j j) E (w j 2) w 2. Por una serie de tiempo, aplicar este resultado para obtener el ACF dado anteriormente. Un modelo MA invertible es uno que puede ser escrito como un modelo AR orden infinito que converge de manera que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el (1) modelo de MA. Tenemos entonces sustituto de la relación (2) A la hora de w t-1 en la ecuación (1) (3) (ZT en peso theta1 (z - theta1w) en peso theta1z - theta2w) t-2. la ecuación (2) se convierte en A continuación, sustituir relación (4) para W t-2 en la ecuación (3) (ZT en peso theta1 z - theta21w peso theta1z - theta21 (z - theta1w) en peso theta1z - theta12z theta31w) Si tuviéramos que continuar ( infinitamente), obtendríamos el modelo AR orden infinito (ZT en peso theta1 z - theta21z theta31z - theta41z puntos) Obsérvese, sin embargo, que si 1 1, los coeficientes multiplicadores de los retardos z aumentará (infinitamente) de tamaño a medida que avanzamos en la espalda hora. Para evitar esto, necesitamos 1 LT1. Esta es la condición para un MA (1) modelo invertible. Modelo de la orden infinito MA En la semana 3, así que ver un AR (1) modelo puede ser convertido en un modelo de orden infinito MA: (xt - mu peso phi1w phi21w puntos phik1 w puntos resumen phij1w) Esta suma de términos de ruido blanco es conocido últimos como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos que se remontan en el tiempo. Esto se llama una orden infinito MA o MA (). Una orden MA finito es un AR orden infinito y cualquier orden de AR finito es un MA orden infinito. Recordemos en la semana 1, se observó que la exigencia de un AR estacionario (1) es que 1 LT1. Permite calcular el Var (x t) utilizando la representación causal. Este último paso se utiliza un hecho básico acerca serie geométrica que requiere (phi1lt1) diverge de lo contrario las series. Navegación

No comments:

Post a Comment