Sunday 6 January 2019

Sazonalidade centrada móvel média


Ao calcular uma média móvel em execução, colocar a média no período de tempo médio faz sentido No exemplo anterior, calculamos a média dos três primeiros períodos de tempo e colocá-lo próximo ao período 3. Poderíamos ter colocado a média no meio da Intervalo de tempo de três períodos, ou seja, próximo ao período 2. Isso funciona bem com períodos de tempo ímpar, mas não é tão bom para mesmo períodos de tempo. Então, onde colocamos a primeira média móvel quando M4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar esse problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados Se nós formos uma média de um número par de termos, precisamos suavizar os valores suavizados A tabela a seguir mostra os resultados usando M 4.Seleção de folha de cálculo do ajuste sazonal e Alisamento exponencial É fácil realizar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização linear exponencial nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente por meio de suavização exponencial linear e (iii) finalmente as previsões ajustadas sazonalmente são quasi mensuradas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - ie. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome de intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot). O modelo LES é inicializado ao definir as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Podemos também usar Holt8217s ao invés de Brown8217s modelo LES, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são utilizados na previsão.) Os erros são calculados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a prever até O terceiro período (linha 15 na planilha). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o mínimo RMSE seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no intervalo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa com a mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e autocorrelação dos erros, bem como sobre o erro quadrático médio, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quotreação nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa ao avanço do valor de alfa para introduzir mais conservadorismo em previsões de longo prazo, um fator quottrend de amortecimento é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. A etapa final na construção do modelo de previsão é a de igualar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Assim, as projeções reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo-frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão, porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. De modo que o intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular limites de confiança para a previsão do LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais de um período à frente, tomando todas as fontes de A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão de 2 etapas e use isso como base para um intervalo de confiança de duas etapas. Análise Previsível com o Microsoft Excel: Trabalhando com séries temporais sazonais neste capítulo Médias Sazonais Simples Médias Movimentadas e Centradas Médias Móveis Regressão Linear com Vetores Codificados Simples Sazonal Suavização Exponencial Modelos Holt-Invernos As questões ficam cada vez mais complicadas quando você tem uma série de tempo caracterizada, em parte, pela sazonalidade: a tendência de seu nível subir e descer de acordo com a passagem das estações . Nós usamos a estação do termo em um sentido mais geral do que seu significado diário do ano de 8217s quatro estações. No contexto da análise preditiva, uma estação pode ser um dia se os padrões repetem semanalmente, ou um ano em termos de ciclos de eleição presidencial, ou apenas sobre qualquer coisa no meio. Um turno de oito horas em um hospital pode representar uma temporada. Este capítulo dá uma olhada em como decompor uma série de tempo para que você possa ver como sua sazonalidade opera além de sua tendência (se houver). Como você poderia esperar do material nos Capítulos 3 e 4, várias abordagens estão disponíveis para você. Médias Sazonais Simples O uso de médias sazonais simples para modelar uma série temporal às vezes pode fornecer um modelo relativamente bruto para os dados. Mas a abordagem presta atenção às estações no conjunto de dados, e pode facilmente ser muito mais preciso como uma técnica de previsão do que simples suavização exponencial quando a sazonalidade é pronunciada. Certamente ele serve como uma introdução útil para alguns dos procedimentos usados ​​com séries temporais que são sazonais e tendência, então dê uma olhada no exemplo da Figura 5.1. Figura 5.1 Com um modelo horizontal, médias simples resultam em previsões que não são mais do que meios sazonais. Os dados e gráficos mostrados na Figura 5.1 representam o número médio de acessos diários a um site que atende aos fãs da Liga Nacional de Futebol. Cada observação na coluna D representa o número médio de acessos por dia em cada um dos quatro trimestres ao longo de um período de cinco anos. Identificando um padrão sazonal Você pode dizer a partir das médias na faixa G2: G5 que um efeito trimestral distinto está ocorrendo. O maior número médio de hits ocorre durante o outono e inverno, quando os principais 16 jogos e os playoffs são programados. Os juros, medidos pelos acertos médios diários, diminuem durante os meses de primavera e verão. As médias são fáceis de calcular ou não você se sinta confortável com fórmulas de matriz. Para obter a média de todas as cinco instâncias do trimestre 1, por exemplo, você pode usar esta fórmula de matriz na célula G2 da Figura 5.1: Array-digite-a com CtrlShiftEnter. Ou você pode usar a função AVERAGEIF (), que você pode digitar da maneira normal, pressionando a tecla Enter. Em geral, eu prefiro a abordagem de matriz de fórmula porque me dá espaço para um maior controle sobre as funções e critérios envolvidos. A série de dados gráficos inclui rótulos de dados que mostram que trimestre cada ponto de dados pertence. O gráfico ecoa a mensagem das médias em G2: G5: Quarters 1 e 4 repetidamente obter a maioria dos hits. A sazonalidade não é clara neste conjunto de dados. Calculando Índices Sazonais Depois de ter decidido que uma série temporal tem uma componente sazonal, você gostaria de quantificar o tamanho do efeito. As médias mostradas na Figura 5.2 representam como o método das médias simples realiza essa tarefa. Figura 5.2 Combine a grande média com as médias sazonais para obter os índices sazonais. Na Figura 5.2. Você obtém índices sazonais aditivos na faixa G10: G13 subtraindo a média grande na célula G7 de cada média sazonal em G2: G5. O resultado é o 8220effect8221 de estar no Quarto 1, de estar no Quarto 2, e assim por diante. Se um determinado mês estiver no 1 º trimestre, você espera que ele tenha 99,65 mais batidas diárias médias do que a grande média de 140,35 hits por dia. Esta informação dá-lhe um sentido de como importante é estar em uma determinada estação. Suponha que você possui o site em questão e você quer vender espaço publicitário nele. Você pode certamente pedir um preço mais alto de anunciantes durante o primeiro e quarto trimestres do que durante o segundo e terceiro. Mais ao ponto, você pode carregar provavelmente duas vezes tanto durante o primeiro quarto do que durante o segundo ou terceiro. Com os índices sazonais na mão, você também está em uma posição para calcular os ajustes sazonais. Por exemplo, ainda na Figura 5.2. Os valores corrigidos de sazonalidade para cada trimestre em 2005 aparecem no G16: G19. Eles são calculados subtraindo o índice da medida trimestral associada. Tradicionalmente, o termo índice sazonal refere-se ao aumento ou diminuição do nível de uma série de 8217s associada a cada estação. O efeito sinônimo sazonal tem aparecido na literatura nos últimos anos. Porque você verá ambos os termos, I8217ve os usou ambos neste livro. É uma questão pequena, basta ter em mente que os dois termos têm o mesmo significado. Observe que, no curso normal dos eventos de 2001 a 2005, você espera que os resultados do segundo trimestre fiquem atrás dos resultados do primeiro trimestre em 133,6 (ou seja, 99,65 menos 821133,95). Mas em 2004 e 2005, os resultados ajustados sazonalmente para o segundo quarto excedem aqueles para o primeiro quarto. Esse resultado pode muito bem levá-lo a perguntar o que mudou nos últimos dois anos que inverte a relação entre os resultados ajustados sazonalmente para os dois primeiros trimestres. (I don8217t perseguir essa questão aqui. Eu trago-lo para sugerir que você quer muitas vezes ter um olhar tanto o observado e os dados ajustados sazonalmente.) Previsão a partir de Médias Sazonais Simples: Sem Tendência Embora o método de médias simples is8212as como eu disse Pode ser muito mais preciso do que a alternativa mais sofisticada de suavização exponencial, particularmente quando os efeitos sazonais são pronunciados e confiáveis. Quando a série de tempo não é alterada, como é o caso com o exemplo discutido nesta seção, as previsões sazonais simples são nada mais do que as médias sazonais. Quando a série não tende para cima ou para baixo, sua melhor estimativa do valor para a próxima temporada é que season8217s média histórica. Consulte a Figura 5.3. Figura 5.3 Combine a grande média com as médias sazonais para obter os índices sazonais. No gráfico da Figura 5.3. A linha tracejada representa as previsões a partir de suavização simples. As duas linhas contínuas representam as observações sazonais reais e as médias sazonais. Observe que as médias sazonais acompanham as observações sazonais reais de forma muito mais próxima do que as previsões suavizadas. Você pode ver quanto mais próximo dos dois RMSEs nas células F23 e H23. O RMSE para as médias sazonais é apenas um pouco mais de um terço do RMSE para as previsões suavizadas. Você pode calcular que até o tamanho dos efeitos sazonais, bem como a sua consistência: Suponha, por exemplo, que a diferença entre a média primeiro e segundo trimestres foram 35,0 em vez de 133,6 (que é a diferença entre as células G2 e G3 na Figura 5.2). Em seguida, num contexto de suavização, o valor real para o trimestre 1 seria um preditor muito melhor do valor para o trimestre 2 do que é o caso com esta série de tempo. E a suavização exponencial pode depender fortemente do valor da observação atual para sua previsão do próximo período. Se a constante de suavização é ajustada em 1,0, a suavização exponencial resolve a previsão na239ve ea previsão sempre é igual à real anterior. O fato de que o tamanho de cada variação sazonal é tão consistente de trimestre para trimestre significa que as médias sazonais simples são previsões confiáveis: Nenhuma observação trimestral real parte muito longe da média sazonal geral. Médias sazonais simples com tendência O uso de médias sazonais simples com uma série de tendências tem algumas desvantagens reais, e I8217m tentado a sugerir que nós ignorá-lo e passar para tópicos meatier. Mas é possível que você se deparar com situações em que alguém tenha usado esse método e, em seguida, não duvidará saber como ele funciona e por que há melhores escolhas. Qualquer método de lidar com a sazonalidade em uma série tendencializada deve lidar com o problema fundamental de desenredar o efeito da tendência daquela da sazonalidade. A sazonalidade tende a obscurecer a tendência, e vice-versa. Consulte a Figura 5.4. Figura 5.4 A presença de tendência complica o cálculo dos efeitos sazonais. O fato de que a tendência na série é para cima ao longo do tempo significa que simplesmente a média de cada temporada 8217s observações, como foi feito no caso sem tendência, confunde a tendência geral com a variação sazonal. A idéia usual é explicar a tendência separadamente dos efeitos sazonais. Você poderia quantificar a tendência e subtrair seu efeito dos dados observados. O resultado é uma série sem tendência que mantém a variação sazonal. Poderia ser tratado da mesma maneira como eu ilustrado anteriormente neste capítulo. Calculando a média para cada ano Uma maneira de detrend os dados (e outras maneiras sem dúvida ocorrerá a você) é calcular a tendência baseada em médias anuais ao invés de dados trimestrais. A idéia é que a média anual é insensível aos efeitos sazonais. Ou seja, se você subtrair um ano de média do valor de cada um de seus trimestres, a soma (e, portanto, a média) dos quatro efeitos trimestrais é precisamente zero. Portanto, uma tendência calculada com base nas médias anuais não é afetada pelas variações sazonais. Esse cálculo aparece na Figura 5.5. Figura 5.5 Este método agora impõe uma regressão linear sobre as médias simples. O primeiro passo para detrending os dados é obter a média diária hits para cada ano. That8217s feito na faixa H3: H7 na Figura 5.5. A fórmula na célula H3, por exemplo, é MÉDIA (D3: D6). Calculando a tendência com base em médias anuais Com as médias anuais na mão, você está em uma posição para calcular sua tendência. That8217s gerenciado usando LINEST () no intervalo I3: J7, usando esta fórmula de matriz: Se você don8217t fornecer x-values ​​como o segundo argumento para PROJ. LIN (). O Excel fornece valores x padrão para você. Os padrões são simplesmente os inteiros consecutivos começando com 1 e terminando com o número de valores y que você chama no primeiro argumento. Neste exemplo, os valores x padrão são idênticos aos especificados na planilha no G3: G7, portanto, você poderia usar PROJ. LIN (H3: H7. VERDADEIRO). Esta fórmula usa dois padrões, para os valores x e a constante, representada pelas três vírgulas consecutivas. O objetivo deste exercício é quantificar a tendência de ano para ano, e PROJ. LIN () faz isso para você na célula I3. Essa célula contém o coeficiente de regressão para os valores de x. Multiplique 106,08 por 1 então por 2 então por 3, 4 e 5 e adicione a cada resultado a intercepção de 84,63. Apesar disso, o ponto importante para este procedimento é o valor do coeficiente 106,08, que quantifica a tendência anual. O passo que eu acabei de discutir é a fonte de minhas dúvidas sobre toda a abordagem descrita nesta seção. Normalmente, você tem um pequeno número de períodos abrangentes no exemplo, que é para executar a regressão. Os resultados da regressão tendem a ser terrivelmente instáveis ​​quando, como aqui, eles são baseados em um pequeno número de observações. E, no entanto, esse procedimento depende muito desses resultados para diminuir a tendência das séries temporais. Prorratear a tendência ao longo das estações O método das médias simples de lidar com uma série sazonal tendencializada como esta continua dividindo a tendência pelo número de períodos no período abrangente para obter uma tendência por período. Aqui, o número de períodos por ano é de quatro8212we8217re trabalhando com dados trimestrais8212e dividimos 106,08 por 4 para estimar a tendência por trimestre em 26,5. O procedimento usa essa tendência periódica subtraindo-a do resultado periódico médio. O objetivo é eliminar o efeito da tendência anual dos efeitos sazonais. Primeiro, porém, precisamos calcular o resultado médio em todos os cinco anos para o Período 1, para o Período 2 e assim por diante. Para fazer isso, ajuda a reorganizar a lista de hits trimestrais reais, mostrados na faixa D3: D22 da Figura 5.5. Em uma matriz de cinco anos por quatro quartos, mostrados no intervalo G11: J15. Observe que os valores nessa matriz correspondem à lista na coluna D. Com os dados dispostos dessa forma, é fácil calcular o valor médio trimestral ao longo dos cinco anos no conjunto de dados. That8217s feito no intervalo G18: J18. O efeito da tendência retornada por PROJ. LIN () aparece no intervalo G19: J19. O valor inicial para cada ano é a média observada de acessos diários para o primeiro trimestre, portanto, não fazemos nenhum ajuste para o primeiro trimestre. Um quarto de 8217s vale a pena de tendência, ou 26,5, é subtraído do segundo quarter8217s média hits, resultando em um ajustado segundo trimestre valor de 329,9 (ver célula H21, Figura 5.5). Dois quarters8217 de tendência, 2 215 26,5 ou 53 na célula I19, é subtraído da média do terceiro trimestre de 8217s para obter um valor ajustado no terceiro trimestre de 282,6 na célula I21. E da mesma forma para o quarto trimestre, subtraindo três quartos da tendência de 454,4 para obter 374,8 na célula J21. Lembre-se de que, se a tendência fosse menor do que acima, como neste exemplo, você adicionaria o valor de tendência periódica aos meios periódicos observados em vez de subtraí-lo. Convertendo os Meios Sazonais Ajustados aos Efeitos Sazonais Segundo a lógica deste método, os valores mostrados nas linhas 20821121 da Figura 5.5 são os resultados trimestrais médios para cada um dos quatro trimestres, com o efeito da tendência geral ascendente no conjunto de dados removido. (As linhas 20 e 21 são fundidas nas colunas G a J.) Com sua tendência fora do caminho, podemos converter esses números para estimativas de efeitos sazonais. O resultado de estar no primeiro trimestre, no segundo trimestre, e assim por diante. Para obter esses efeitos, comece por calcular a média geral dos meios trimestrais ajustados. Essa grande média ajustada aparece na célula I23. A análise continua na Figura 5.6. Figura 5.6 Os efeitos trimestrais, ou índices, são usados ​​para dessazonalizar os trimestres observados. A Figura 5.6 repete os ajustes trimestrais e a grande média ajustada do fundo da Figura 5.5. Eles são combinados para determinar os índices trimestrais (que você também pode pensar como efeitos sazonais). Por exemplo, a fórmula na célula D8 é a seguinte: Retorna 821133.2. Em relação ao grande meio, podemos esperar que um resultado que pertence ao segundo trimestre caia abaixo da grande média em 33,2 unidades. Aplicando os efeitos sazonais aos trimestres observados Para recapitular: Até agora, nós quantificamos a tendência anual nos dados por meio de regressão e dividimos essa tendência por 4 para propor-la a um valor trimestral. Pegando na Figura 5.6. Ajustamos a média para cada trimestre (em C3: F3) subtraindo as tendências proporcionais em C4: F4. O resultado é uma estimativa da média de cada trimestre, independentemente do ano em que o trimestre ocorre, em C5: F5. Subtraímos a média grande ajustada, na célula G5, da média trimestral ajustada em C5: F5. Isso converte cada trimestre em uma medida do efeito de cada trimestre em relação à média grande ajustada. Esses são os índices ou efeitos sazonais em C8: F8. Em seguida, removemos os efeitos sazonais dos trimestres observados. Conforme mostrado na Figura 5.6. Você faz isso subtraindo os índices trimestrais em C8: F8 dos valores correspondentes em C12: F16. E a maneira mais fácil de fazer isso é inserir esta fórmula na célula C20: Observe o único sinal de dólar antes do 8 na referência a C8. Essa é uma referência mista: parcialmente relativa e parcialmente absoluta. O sinal de dólar ancora a referência à oitava linha, mas a parte da coluna da referência é livre para variar. Portanto, depois que a última fórmula for inserida na célula C20, você pode clicar na alça de seleção cell8217s (o pequeno quadrado no canto inferior direito de uma célula selecionada) e arrastar para a direita na célula F20. Os endereços são ajustados à medida que você arrasta para a direita e você termina com os valores, com os efeitos sazonais removidos, para o ano de 2001 em C20: F20. Selecione esse intervalo de quatro células e use o identificador multiple selection8217s, agora em F20, para arrastar para baixo na linha 24. Assim fazendo preenche o restante da matriz. É importante ter em mente aqui que estamos ajustando os valores trimestrais originais para os efeitos sazonais. Seja qual for a tendência que existisse nos valores originais, ainda existe, e, na teoria, pelo menos 8212 permanece lá depois de termos feito os ajustes para os efeitos sazonais. Removemos uma tendência, sim, mas apenas dos efeitos sazonais. Assim, quando subtraímos os efeitos sazonais (detrended) das observações trimestrais originais, o resultado são as observações originais com a tendência, mas sem os efeitos sazonais. Eu tracei esses valores ajustados sazonalmente na Figura 5.6. Compare esse gráfico com o gráfico da Figura 5.4. Observe na Figura 5.6 que embora os valores dessazonalizados não estejam exatamente em uma linha reta, grande parte do efeito sazonal foi removida. Regressando os trimestrais desestacionalizados para os períodos de tempo O próximo passo é criar previsões a partir dos dados ajustados sazonalmente, tendência na Figura 5.6. Células C20: F24, e neste ponto você tem várias alternativas disponíveis. Você poderia usar a abordagem de diferenciação combinada com a suavização exponencial simples que foi discutida no Capítulo 3, 8220 Trabalhando com a Série de Tempo Trendada.8221 Você também pode usar a abordagem Holt8217s para alisar séries de tendências, discutidas no Capítulo 3 e Capítulo 4, Métodos permitem que você possa criar uma previsão de um passo adiante, à qual você adicionaria o índice sazonal correspondente. Outra abordagem, que aqui se usa, primeiro coloca os dados tendenciosos através de outra instância de regressão linear e depois adiciona o índice sazonal. Consulte a Figura 5.7. Figura 5.7 A primeira previsão verdadeira está na linha 25. A Figura 5.7 retorna os meios trimestrais dessazonalizados da disposição tabular em C20: F24 da Figura 5.6 para o arranjo de lista na faixa C5: C24 da Figura 5.7. Poderíamos usar LINEST () em conjunto com os dados em B5: C24 na Figura 5.7 para calcular a equação de regressão8217s intercept e coeficiente então, poderíamos multiplicar o coeficiente por cada valor na coluna B, e adicionar o intercepto a cada produto, para criar As previsões na coluna D. Mas embora LINEST () retorna informações úteis que não sejam o coeficiente e interceptar, TREND () é uma forma mais rápida de obter as previsões, e eu usá-lo na Figura 5.7. O intervalo D5: D24 contém as previsões que resultam da regressão dos dados trimestrais dessazonalizados em C5: C24 para os números de período em B5: B24. A fórmula de matriz usada em D5: D24 é a seguinte: Esse conjunto de resultados reflete o efeito da tendência geral ascendente nas séries temporais. Como os valores que a TENDÊNCIA () está prevendo de terem sido dessazonalizados, resta acrescentar os efeitos sazonais, também conhecidos como índices sazonais, à previsão de tendência. Adicionando os índices sazonais de volta Os índices sazonais, calculados na Figura 5.6. São fornecidos na Figura 5.7. Primeiro na gama C2: F2 e depois repetidamente na gama E5: E8, E9: E12, e assim por diante. As previsões reseasonalized são colocadas em F5: F24 adicionando os efeitos sazonais na coluna E às previsões de tendência na coluna D. Para obter a previsão um passo em frente na célula F25 da Figura 5.7. O valor de t para o próximo período vai para a célula B25. A seguinte fórmula é inserida na célula D25: Instrui o Excel a calcular a equação de regressão que prevê valores na faixa C5: C24 daqueles em B5: B24 e aplicar essa equação ao novo valor x na célula B25. O índice sazonal apropriado é colocado na célula E25 ea soma de D25 e E25 é colocada em F25 como a primeira verdadeira previsão das séries temporais tendência e sazonal. Você encontrará todo o conjunto de trimestres desestacionalizados e as previsões traçadas na Figura 5.8. Figura 5.8 Os efeitos sazonais são devolvidos às previsões. Avaliando Médias Simples A abordagem para lidar com uma série temporal sazonal, discutida em várias seções anteriores, tem algum apelo intuitivo. A idéia básica parece direta: Calcule uma tendência anual, regrindo meios anuais contra uma medida de períodos de tempo. Divida a tendência anual entre os períodos dentro do ano. Subtraia a tendência proporcional dos efeitos periódicos para obter efeitos ajustados. Subtraia os efeitos ajustados das medidas reais para dessazonalizar as séries temporais. Criar previsões a partir da série dessazonalizada e adicionar os efeitos sazonais ajustados de volta dentro Minha opinião é que vários problemas enfraquecem a abordagem, e eu não teria incluído neste livro, exceto que você é provável que encontrá-lo e, portanto, deve ser familiar com isso. E fornece um trampolim útil para discutir alguns conceitos e procedimentos encontrados em outras abordagens mais fortes. Em primeiro lugar, a questão (sobre qual eu me queixei anteriormente neste capítulo) sobre o tamanho de amostra muito pequeno para a regressão de médias anuais em inteiros consecutivos que identificam cada ano. Mesmo com apenas um preditor, apenas 10 observações estão realmente raspando o fundo do barril. Pelo menos você deve olhar para o R 2 resultante ajustado para encolhimento e, provavelmente, recalcular o erro padrão de estimativa em conformidade. É verdade que quanto mais forte a correlação na população, menor a amostra que você pode se safar. Mas trabalhando com trimestres dentro de anos, você tem sorte de encontrar até 10 anos de observações trimestrais consecutivas, cada um medido da mesma maneira em toda essa extensão de tempo. Não estou convencido de que a resposta ao padrão problemático que você encontra dentro de um ano (veja o gráfico na Figura 5.4) é a média dos picos e vales e obter uma estimativa de tendência dos meios anuais. Certamente é uma resposta para esse problema, mas, como você verá, há um método muito mais forte de segregar os efeitos sazonais de uma tendência subjacente, respondendo por ambos, e prever de acordo. I8217ll cobrirão esse método mais adiante neste capítulo, na seção Regressão Linear 8220 com Vectores Codificados8221. Além disso, não há fundamento teórico para distribuir a tendência anual uniformemente entre os períodos que compõem o ano. É verdade que a regressão linear faz algo semelhante quando coloca suas previsões em linha reta. Mas há um enorme abismo entre fazer uma suposição fundamental porque o modelo analítico não pode manipular os dados e aceitar um resultado falho cujos defeitos nas previsões podem ser medidos e avaliados. Dito isto, vamos passar ao uso de médias móveis em vez de médias simples como forma de lidar com a sazonalidade.

No comments:

Post a Comment