Sunday 22 April 2018

Time series forecasting using moving average


O Top Menu Time Series e Forecasting R tem amplas facilidades para analisar dados de séries temporais. Esta seção descreve a criação de uma série de tempo, decomposição sazonal, modelagem com modelos exponenciais e ARIMA e previsão com o pacote de previsão. Criando uma série de tempo A função ts () converterá um vetor numérico em um objeto de série de tempo R. O formato é ts (vetor, início, fim, freqüência) onde início e fim são os tempos da primeira e última observação e freqüência é o número de observações por unidade de tempo (1annual, 4quartly, 12monthly, etc). Salve um vetor numérico contendo 72 observações mensais de janeiro de 2009 a dezembro de 2017 como uma série temporal myts lt ts (myvector, startc (2009, 1), endc (2017, 12), frequency12) subconjunto da série cronológica (junho de 2017 a Decomposição sazonal Uma série temporal com tendência aditiva, componentes sazonais e irregulares pode ser decomposta usando o stl (myt) (). Note-se que uma série com efeitos multiplicativos pode muitas vezes ser transformada em séries com efeitos aditivos através de uma transformação de log (isto é, newts lt-log (myts)). Modelos Exponenciais Tanto a função HoltWinters () na instalação base, como a função ets (), a função ets (), a função ets (), a função de decomposição sazonal lt - stl (myts, s. windowperiod) No pacote de previsão, pode ser usado para ajustar modelos exponenciais. (Myts, betaFALSE, gammaFALSE) duplo exponencial - nível de modelos e tendência de ajuste lt - HoltWinters (myts, gammaFALSE) triplo exponencial - nível de modelos, tendência e componentes sazonais fit lt - HoltWinters (myts) (Previsão) previsão (ajuste, 3) traçado (previsão (ajuste, 3)) ARIMA Modelos A função arima () pode ser usada para ajustar uma movimentação integrada autorregressiva Modelo de médias. Outras funções úteis incluem: versão retardada de séries temporais, deslocadas para trás k observações Uma série de tempo é uma seqüência de observações de uma variável aleatória periódica. Exemplos disso são a demanda mensal por um produto, a matrícula anual de calouros em um departamento da universidade e os fluxos diários em um rio. As séries cronológicas são importantes para a pesquisa operacional, porque muitas vezes são os impulsionadores dos modelos de decisão. Um modelo de inventário requer estimativas de demandas futuras, um planejamento de curso e modelo de pessoal para um departamento universitário requer estimativas de entrada de estudantes futuros e um modelo para fornecer avisos para a população em uma bacia hidrográfica requer estimativas de fluxos de rios para o futuro imediato. A análise de séries temporais fornece ferramentas para selecionar um modelo que descreve as séries temporais e usar o modelo para prever eventos futuros. Modelar a série temporal é um problema estatístico porque os dados observados são usados ​​em procedimentos computacionais para estimar os coeficientes de um suposto modelo. Os modelos assumem que as observações variam aleatoriamente sobre um valor médio subjacente que é uma função do tempo. Nessas páginas, restringimos a atenção ao uso de dados históricos de séries temporais para estimar um modelo dependente do tempo. Os métodos são apropriados para a previsão automática e de curto prazo de informações freqüentemente usadas onde as causas subjacentes da variação de tempo não estão mudando marcadamente no tempo. Na prática, as previsões derivadas por estes métodos são posteriormente modificadas por analistas humanos que incorporam informações não disponíveis a partir dos dados históricos. Nosso propósito principal nesta seção é apresentar as equações para os quatro métodos de previsão usados ​​no suplemento Forecasting: média móvel, suavização exponencial, regressão e suavização exponencial dupla. Estes são chamados de métodos de suavização. Métodos não considerados incluem a previsão qualitativa, regressão múltipla, e métodos autorregressivos (ARIMA). Aqueles interessados ​​em uma cobertura mais ampla devem visitar o site Previsões Princípios ou ler um dos vários excelentes livros sobre o tema. Usamos o livro Previsão. Por Makridakis, Wheelwright e McGee, John Wiley amp Sons, 1983. Para usar o pasta de trabalho Exemplos do Excel, você deve ter o suplemento de Previsão instalado. Escolha o comando Relink para estabelecer os links para o suplemento. Esta página descreve os modelos utilizados para previsão simples e a notação utilizada para a análise. Este método de previsão mais simples é a previsão média móvel. O método simplesmente médias das últimas m observações. É útil para séries temporais com uma média em mudança lenta. Este método considera todo o passado na sua previsão, mas pesa a experiência recente mais fortemente do que menos recente. Os cálculos são simples porque apenas a estimativa do período anterior e os dados atuais determinam a nova estimativa. O método é útil para séries temporais com uma média em mudança lenta. O método da média móvel não responde bem a uma série temporal que aumenta ou diminui com o tempo. Aqui nós incluímos um termo de tendência linear no modelo. O método de regressão aproxima o modelo construindo uma equação linear que fornece o ajuste de mínimos quadrados às últimas m observações. Na prática, a média móvel fornecerá uma boa estimativa da média das séries temporais se a média for constante ou mudar lentamente. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo medirá os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série de tempo usada para ilustração juntamente com a demanda média a partir da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ele aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então ele se torna constante novamente. Os dados são simulados adicionando à média um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o número inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que a qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas juntamente com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas da média móvel para a direita por períodos. Uma conclusão é imediatamente aparente a partir da figura. Para as três estimativas, a média móvel está aquém da tendência linear, com o atraso aumentando com m. O atraso é a distância entre o modelo ea estimativa na dimensão temporal. Devido ao atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um tempo específico no valor médio do modelo eo valor médio predito pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e viés do estimador da média são dados nas equações abaixo. As curvas de exemplo não correspondem a essas equações porque o modelo de exemplo não está aumentando continuamente, em vez disso, ele começa como uma constante, muda para uma tendência e, em seguida, torna-se constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada deslocando as curvas para a direita. O atraso e o viés aumentam proporcionalmente. As equações abaixo indicam o atraso e o viés de um período de previsão para o futuro quando comparado aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel baseia-se no pressuposto de uma média constante, eo exemplo tem uma tendência linear na média durante uma parte do período do estudo. Como as séries de tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para tais resultados. Podemos também concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menor. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero ea variância do erro é composta por um termo que é uma função de e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de m observações, assumindo que os dados provêm de uma população com média constante. Este termo é minimizado fazendo-se o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar a previsão responsiva às mudanças, queremos que m seja o menor possível (1), mas isso aumenta a variância do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de Previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo add-in para os dados da amostra na coluna B. As 10 primeiras observações são indexadas -9 a 0. Em comparação com a tabela acima, os índices de período são deslocados por -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usados ​​para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro de média móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto a partir da média móvel no tempo 0 é 11.1. O erro é então -5.1. O desvio padrão eo Desvio Médio Médio (MAD) são calculados nas células E6 e E7 respectivamente. Previsão com análise de séries temporais O que é previsão A previsão é um método que é utilizado extensivamente na análise de séries temporais para prever uma variável de resposta, como lucros mensais, O desempenho das existências, ou os números de desemprego, por um período de tempo especificado. As previsões são baseadas em padrões em dados existentes. Por exemplo, um gerente de depósito pode modelar a quantidade de produto a ser solicitada nos próximos 3 meses com base nos 12 meses anteriores de pedidos. Você pode usar uma variedade de métodos de séries temporais, como análise de tendências, decomposição ou suavização exponencial única, para modelar padrões nos dados e extrapolar esses padrões para o futuro. Escolha um método de análise se os padrões são estáticos (constantes ao longo do tempo) ou dinâmicos (alteração ao longo do tempo), a natureza da tendência e os componentes sazonais e até que ponto você pretende antecipar. Antes de produzir previsões, encaixe vários modelos candidatos aos dados para determinar qual modelo é o mais estável e preciso. Previsões para uma análise de média móvel O valor ajustado no tempo t é a média móvel não centrada no tempo t -1. As previsões são os valores ajustados na origem prevista. Se você prever 10 unidades de tempo à frente, o valor previsto para cada tempo será o valor ajustado na origem. Os dados até a origem são utilizados para o cálculo das médias móveis. Você pode usar o método de médias móveis lineares calculando médias móveis consecutivas. O método das médias móveis lineares é freqüentemente usado quando há uma tendência nos dados. Primeiro, calcule e armazene a média móvel da série original. Em seguida, calcule e armazene a média móvel da coluna anteriormente armazenada para obter uma segunda média móvel. Na previsão ingênua, a previsão para o tempo t é o valor dos dados no tempo t -1. Usando o procedimento de média móvel com uma média móvel de comprimento um dá previsão ingênua. Previsões para uma única análise exponencial de suavização O valor ajustado no tempo t é o valor suavizado no tempo t-1. As previsões são o valor ajustado na origem prevista. Se você prever 10 unidades de tempo à frente, o valor previsto para cada tempo será o valor ajustado na origem. Os dados até a origem são usados ​​para o alisamento. Na previsão ingênua, a previsão para o tempo t é o valor dos dados no tempo t-1. Execute a suavização exponencial única com um peso de um para fazer previsão ingênua. Previsões para uma análise de suavização exponencial dupla A suavização exponencial dupla utiliza os componentes de nível e tendência para gerar previsões. A previsão para m períodos à frente de um ponto no tempo t é L t mT t. Onde L t é o nível e T t é a tendência no tempo t. Os dados até o tempo de origem previsto serão utilizados para o alisamento. Previsões para o método Winters O método Winters utiliza os componentes de nível, tendência e sazonal para gerar previsões. A previsão para m períodos à frente de um ponto no tempo t é: onde L t é o nível e T t é a tendência no tempo t, multiplicada por (ou adicionada para um modelo aditivo) a componente sazonal para o mesmo período do período ano anterior. O método Winters usa dados até o tempo de origem da previsão para gerar as previsões. Como você pode imaginar, estamos olhando para algumas das abordagens mais primitivas para a previsão. Mas espero que estas sejam pelo menos uma introdução interessante a algumas das questões de computação relacionadas à implementação de previsões em planilhas. Neste sentido, vamos continuar a partir do início e começar a trabalhar com previsões de média móvel. Previsões médias móveis. Todo mundo está familiarizado com as previsões de média móvel, independentemente de eles acreditam que são. Todos os estudantes universitários fazê-los o tempo todo. Pense nas suas pontuações dos testes num curso em que vai ter quatro testes durante o semestre. Vamos supor que você tem um 85 em seu primeiro teste. O que você poderia prever para sua pontuação do segundo teste O que você acha que seu professor iria prever para a sua próxima pontuação de teste O que você acha que seus amigos podem prever para a sua próxima pontuação de teste O que você acha que seus pais podem prever para sua pontuação próxima teste Independentemente de Todo o blabbing você pôde fazer a seus amigos e pais, eles e seu professor são muito prováveis ​​esperar que você comece algo na área do 85 que você começou apenas. Bem, agora vamos supor que, apesar de sua auto-promoção para seus amigos, você superestimar-se e figura que você pode estudar menos para o segundo teste e assim você começa um 73. Agora o que são todos os interessados ​​e despreocupado vai Antecipar você vai chegar em seu terceiro teste Existem duas abordagens muito provável para que eles desenvolvam uma estimativa, independentemente de se eles vão compartilhar com você. Eles podem dizer a si mesmos: "Esse cara está sempre soprando fumaça sobre suas espertinas. Hes que vai obter outro 73 se hes afortunado. Talvez os pais tentem ser mais solidários e dizer: "Bem, até agora você tem obtido um 85 e um 73, então talvez você deve figura em obter cerca de um (85 73) / 2 79. Eu não sei, talvez se você fez menos Festejando e werent abanando a doninhas em todo o lugar e se você começou a fazer muito mais estudando você poderia obter uma pontuação mais alta. quot Ambas as estimativas são, na verdade, média móvel previsões. O primeiro é usar apenas sua pontuação mais recente para prever o seu desempenho futuro. Isso é chamado de média móvel usando um período de dados. A segunda também é uma média móvel, mas usando dois períodos de dados. Vamos supor que todas essas pessoas rebentando em sua grande mente têm tipo de puto você fora e você decidir fazer bem no terceiro teste para suas próprias razões e colocar uma pontuação mais alta na frente de seus quotalliesquot. Você toma o teste e sua pontuação é realmente um 89 Todos, incluindo você mesmo, está impressionado. Então agora você tem o teste final do semestre chegando e, como de costume, você sente a necessidade de incitar todo mundo a fazer suas predições sobre como você vai fazer no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. Qual você acha que é o apito mais preciso enquanto trabalhamos. Agora vamos voltar para a nossa nova empresa de limpeza iniciada por sua meia irmã distante chamado Whistle While We Work. Você tem alguns dados de vendas anteriores representados na seção a seguir de uma planilha. Primeiro, apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C7 a C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que nós realmente não precisamos fazer as previsões para os períodos passados, a fim de desenvolver a nossa previsão mais recente. Isto é definitivamente diferente do modelo de suavização exponencial. Ive incluído o quotpast previsõesquot porque vamos usá-los na próxima página da web para medir a validade de previsão. Agora eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula de célula para baixo para as outras células C6 a C11. Observe como agora apenas as duas mais recentes peças de dados históricos são utilizados para cada previsão. Mais uma vez incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são de importância notar. Para uma previsão média móvel de m-período, apenas os m valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel de m-período, ao fazer previsões quotpastquot, observe que a primeira predição ocorre no período m 1. Ambas as questões serão muito significativas quando desenvolvemos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão da média móvel que pode ser usado de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que você deseja usar na previsão ea matriz de valores históricos. Você pode armazená-lo em qualquer pasta de trabalho que você deseja. Função MovingAverage (Histórico, NumberOfPeriods) Como Único Declarar e inicializar variáveis ​​Dim Item Como variante Dim Counter Como Inteiro Dim Acumulação como único Dim HistoricalSize As Inteiro Inicializando variáveis ​​Counter 1 Acumulação 0 Determinando o tamanho da Historical array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Acumulação / NumberOfPeriods O código será explicado na classe. Você deseja posicionar a função na planilha para que o resultado da computação seja exibido onde ele deve gostar do seguinte.

No comments:

Post a Comment