Sunday 26 November 2017

Outoregressiewe Bewegende Gemiddelde Model Excel


ARMA Unplugged Dit is die eerste inskrywing in ons reeks van Unplugged tutoriale, waarin ons delf in die besonderhede van elk van die tydreeks modelle waarmee jy reeds vertroud, met klem op die onderliggende aannames en ry huis die intuïsies agter hulle. In hierdie uitgawe, ons pak die ARMA model 'n hoeksteen in die tyd reeks modelle. In teenstelling met vroeër ontleding kwessies, sal ons begin hier met die proses definisie ARMA, stel die insette, uitsette, parameters, stabiliteit beperkings, aannames, en uiteindelik trek 'n paar riglyne vir die modelleringsproses. Agtergrond Per definisie, die motor-regressiewe bewegende gemiddelde (ARMA) is 'n stilstaande stogastiese proses bestaan ​​uit bedrae outoregressiewe Excel en bewegende gemiddelde komponente. Alternatiewelik, in 'n eenvoudige formulering: Aannames Kom ons kyk nader aan die formulering. Die ARMA proses is bloot 'n geweegde som van die verlede uitset waarnemings en skokke, met 'n paar sleutelaannames: Wat doen hierdie aannames beteken 'n stogastiese proses is 'n eweknie van 'n deterministiese proses dit beskryf die evolusie van 'n ewekansige veranderlike oor tyd. In ons geval, die ewekansige veranderlike is die ARMA proses net vang die korrelasie (dit wil sê outokorrelasie) tussen die waarnemings. In gewone woorde, die ARMA proses vat die waardes van die verlede waarnemings, nie hul kwadraat waardes of hul logaritmes, ens Hoër orde afhanklikheid mandate 'n ander proses (bv ARCH / GARCH, nie-lineêre modelle, ens). Daar is talle voorbeelde van 'n stogastiese proses waar afgelope waardes beïnvloed huidige kinders. Byvoorbeeld, in 'n verkope kantoor wat RFQs ontvang op 'n deurlopende basis, 'n paar realiseer as verkope-gewen het, 'n paar as verkope verlore, en 'n paar oorgespoel na die volgende maand. As gevolg hiervan, in enige gegewe maand, 'n paar van die verkope-gewen gevalle ontstaan ​​as RFQs of herhaal verkoop van die vorige maande. Wat is die skokke, innovasies of foute terme Dit is moeilike vraag, en die antwoord is nie minder verwarrend. Tog, kan gee dit 'n probeer: In eenvoudige woorde, die foutterm in 'n gegewe model is 'n catch-all emmer vir al die variasies wat die model verduidelik nie. Tog verloor Lets gebruik 'n voorbeeld. Vir 'n aandeelprys proses, is daar moontlik honderde faktore wat die prys vlak op / af te ry, insluitend: Dividende en Split aankondigings kwartaallikse verdienste-verslae samesmeltings en verkrygings (MampA) aktiwiteite Regte gebeure, bv die bedreiging van klasaksie regsgedinge. Ander 'n model, deur ontwerp, is 'n vereenvoudiging van 'n komplekse werklikheid, so wat ons verlaat buite die model outomaties bundel in die foutterm. Die ARMA proses veronderstel dat die kollektiewe effek van al die faktore tree min of meer soos Gaussiese ruis. Hoekom doen ons omgee afgelope skokke In teenstelling met 'n regressiemodel, kan die voorkoms van 'n stimulus (bv skok) 'n uitwerking op die huidige vlak, en moontlik toekomstige vlakke. Byvoorbeeld, 'n korporatiewe gebeurtenis (bv MampA aktiwiteit) beïnvloed die onder het maatskappy aandele prys, maar die verandering kan enige tyd neem om sy volle impak te hê, as deelnemers aan die mark te absorbeer / die beskikbare inligting te ontleed en daarvolgens reageer. Dit lei tot die vraag: moenie die afgelope waardes van die uitset reeds die skokke afgelope inligting JA, die skokke geskiedenis is reeds vir die afgelope uitset vlakke verantwoordelik. 'N ARMA model kan slegs voorgestel word as 'n suiwer motor-regressief (AR) model, maar die stoor vereiste van so 'n stelsel in oneindige. Dit is die enigste rede om die MA komponent sluit in: om te bespaar op die stoor en die formulering vereenvoudig. Weereens, moet die ARMA proses stilstaande wees vir die marginale (onvoorwaardelike) afwyking te bestaan. Let wel: In my bespreking hierbo, ek is nie 'n onderskeid tussen bloot die afwesigheid van 'n eenheid wortel in die karakteristieke vergelyking en die stasionariteit van die proses. Hulle is verwant, maar die afwesigheid van 'n eenheid wortel is nie 'n waarborg van stasionariteit. Tog, moet die eenheid wortel wees leuen in die eenheidsirkel om akkuraat te wees. Gevolgtrekking Kom herhaling wat ons tot dusver gedoen het. Eerste ondersoek ons ​​'n stilstaande ARMA proses, saam met die formulering daarvan, insette, aannames, en stoor vereistes. Volgende, ons het getoon dat 'n ARMA proses inkorporeer sy produksie waardes (outokorrelasie) en skokke dit vroeër ervaar in die huidige produksie. Ten slotte, ons het getoon dat die stilstaande ARMA proses produseer 'n tydreeks met 'n stabiele langtermyn gemiddelde en variansie. In ons data-analise, voordat ons voor 'n ARMA model, ons behoort aan die stasionariteit aanname en die beperkte geheue vereistes verifieer. In die geval van die datareeks vertoon 'n deterministiese tendens, moet ons eers verwyder (de-tendens), en gebruik dan die residue vir ARMA. In die geval van die datastel vertoon 'n stogastiese tendens (bv ewekansige loop) of seisoenaliteit, moet ons vermaak ARIMA / SARIMA. Ten slotte, kan die correlogram (dit wil sê ACF / PACF) gebruik word om die geheue vereiste van die model wat ons moet verwag nie ACF of PACF om vinnig verval na 'n paar lags meet. Indien nie, kan dit 'n teken van nie-stasionariteit of 'n langtermyn-patroon (bv ARFIMA) Een voorsien vol Rima staan ​​vir outoregressiewe geïntegreerde bewegende gemiddelde modelle wees. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan ​​bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan ​​slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science. ARIMA vooruitskatting met Excel en R Hallo Vandag gaan ek om jou te wandel deur 'n inleiding tot die ARIMA model en sy komponente, sowel as 'n kort verduideliking van die Box-Jenkins metode van hoe ARIMA modelle gespesifiseer. Laastens, ek geskep n Excel implementering met behulp van R, wat Siek wys jou hoe om te stel en te gebruik. Outoregressiewe bewegende gemiddelde (ARMA) Models Die outoregressiewe bewegende gemiddelde model word gebruik vir modellering en voorspelling van skryfbehoeftes, stogastiese time-reeks prosesse. Dit is die kombinasie van twee voorheen ontwikkel statistiese tegnieke, die outoregressiewe (AR) en bewegende gemiddelde (MA) modelle en is oorspronklik beskryf deur Peter Whittle in 1951. George E. P. Boks en Gwilym Jenkins gewild die model in 1971 deur die spesifiseer van diskrete stappe om identifisering, beraming en verifikasie model. Hierdie proses sal later beskryf word ter inligting weergegee. Ons sal begin deur die instelling van die ARMA model deur sy verskillende komponente, die AR, en MA modelle en dan aan te bied 'n gewilde veralgemening van die ARMA model, ARIMA (outoregressiewe geïntegreerde bewegende gemiddelde) en vooruitskatting en model spesifikasie stappe. Laastens sal ek 'n Excel implementering ek geskep het en hoe om dit te gebruik om jou tyd reeks voorspellings te maak verduidelik. Outoregressiemodelle Die outoregressiewe model word gebruik vir die beskrywing van ewekansige prosesse en-time wisselende prosesse en spesifiseer die uitset veranderlike hang lineêr op sy vorige waardes. Die model word beskryf as: Waar is die parameters van die model, C konstant is, en is 'n wit geraas termyn. In wese, wat die model beskryf is vir enige gegewe waarde. Dit kan verklaar word deur funksies van sy vorige waarde. Vir 'n model met 'n parameter,. word verklaar deur sy verlede waarde en ewekansige fout. Vir 'n model met meer as een parameter, byvoorbeeld. gegee word deur. en ewekansige fout. Bewegende gemiddelde Model Die bewegende gemiddelde (MA) model word dikwels gebruik vir modellering eenveranderlike tydreekse en word gedefinieer as: is die gemiddeld van die tydreeks. is die parameters van die model. is die wit geraas fout terme. is aan die orde van die bewegende gemiddelde model. Die bewegende gemiddelde model is 'n lineêre regressie van die huidige waarde van die reeks in vergelyking met terme wat in die vorige tydperk. . Byvoorbeeld, 'n MA-model van. word verklaar deur die huidige fout in dieselfde tydperk en die afgelope fout waarde. Vir 'n model van orde 2 (), word verklaar deur die afgelope twee foutwaardes, en. Die AR () en MA () terme gebruik in die ARMA model, wat nou sal bekendgestel word. Outoregressiewe bewegende gemiddelde Model outoregressiewe bewegende gemiddelde modelle gebruik twee polinome, AR () en MA () en beskryf 'n stilstaande stogastiese proses. 'N Stilstaande proses verander nie wanneer verskuif in tyd of ruimte, dus, 'n stilstaande proses het konstante gemiddelde en variansie. Die ARMA model word dikwels in terme van sy polinome, ARMA verwys (). Die notering van die model is geskrywe: Die kies, te skat en die verifikasie van die model is beskryf deur die Box-Jenkins proses. Box-Jenkins Metode vir modelidentifisering Die onderstaande is meer van 'n uiteensetting van die Box-Jenkins metode, soos die werklike proses om hierdie waardes kan nogal oorweldigend sonder 'n statistiese pakket wees. Die Excel vel opgeneem op hierdie blad bepaal outomaties die beste pas model. Die eerste stap van die Box-Jenkins metode is model identifikasie. Die stap sluit die identifisering van seisoenaliteit, breukmetodes indien nodig en die bepaling van die orde van en deur die plot die outokorrelasie en gedeeltelike outokorrelasiefunksies. Na afloop van die model is geïdentifiseer, is die volgende stap die skatte van die parameters. Parameter beraming gebruik statistiese pakkette en berekening algoritmes om die beste pas parameters vind. Sodra die parameters gekies, is die laaste stap nagaan van die model. Model nagaan word gedoen deur die toets om te sien of die model voldoen aan 'n stilstaande eenveranderlike tydreekse. 'N Mens moet ook bevestig die residue is onafhanklik van mekaar en toon konstante gemiddelde en variansie met verloop van tyd, wat kan gedoen word deur die uitvoering van 'n Ljung-Box toets of weer plot die outokorrelasie en gedeeltelike outokorrelasie van die residue. Let op die eerste stap behels die nagaan vir die seisoen. As die data wat jy besig is met 'bevat seisoenale tendense, jy verskil ten einde die data stilstaande maak. Dit breukmetodes stap veralgemeen die ARMA model in 'n ARIMA model, of outoregressiewe geïntegreerde bewegende gemiddelde, waar Geïntegreerde ooreenstem met die breukmetodes stap. Outoregressiewe geïntegreerde bewegende gemiddelde modelle Die ARIMA model het drie parameters,. Met die oog op die ARMA model definieer die breukmetodes termyn sluit, het ons begin deur rangskik die standaard ARMA model te skei en uit die opsomming. Waar is die lag operateur en. . is outoregressiewe en bewegende gemiddelde parameters, en die fout terme, onderskeidelik. Ons maak nou die aanname van die eerste polinoom van die funksie, het 'n unitêre wortel van multiplisiteit. Ons kan dan herskryf dit na die volgende: Die ARIMA model spreek die polinoom faktorisering met en gee ons: Laastens, ons veralgemeen die model verder deur die toevoeging van 'n drif termyn, wat die ARIMA model as ARIMA definieer () met drif. Met die model nou gedefinieer is, kan ons die ARIMA model sien as twee aparte dele, een nie-stasionêre en die ander 'n wye sin stilstaande (gesamentlike kans verdeling nie verander wanneer verskuif in tyd of ruimte). Die nie-stasionêre model: die wye sin stilstaande model: Voorspellings kan nou gemaak word oor die gebruik van 'n algemene outoregressiewe vooruitskatting metode. Noudat ons die ARMA en ARIMA modelle bespreek, ons nou kyk na hoe kan ons dit gebruik in praktiese toepassings te voorspelling verskaf. Ive gebou 'n uitvoering met Excel gebruik van R te ARIMA voorspellings te maak, sowel as 'n opsie om Monte Carlo simulasie loop op die model om die waarskynlikheid van die voorspellings te bepaal. Excel Implementering en Hoe om te gebruik voordat die gebruik van die vel, moet jy R en RExcel aflaai van die Statconn webwerf. As jy reeds R geïnstalleer is, kan jy net RExcel aflaai. As jy dit nie het R geïnstalleer is, kan jy RAndFriends wat die nuutste weergawe van R en RExcel bevat te laai. Let wel, RExcel werk net op 32bit Excel vir sy nie-kommersiële lisensie. As jy 64bit Excel geïnstalleer is, sal jy 'n kommersiële lisensie van Statconn kry. Dit word aanbeveel om RAndFriends aflaai, want dit maak vir die vinnigste en maklikste installasie As jy egter reeds R het en wil dit met die hand te installeer, volg hierdie volgende stappe. Met die hand te installeer RExcel Om RExcel en die ander pakkette te installeer om R werk in Excel, eerste oop R maak as 'n administrateur deur regs te klik op die exe. In die R konsole, installeer RExcel deur te tik die volgende stellings: Bogenoemde opdragte sal RExcel installeer op jou rekenaar. Die volgende stap is om kamertemperatuur, wat ook 'n pakket van Statconn vir die RExcel pakket te installeer. Om dit te installeer, tik die volgende opdragte, wat ook outomaties installeer rscproxy as van R weergawe 2.8.0. Met hierdie pakkette geïnstalleer, kan jy gaan na om die opstel van die verband tussen R en Excel. Alhoewel dit nie nodig is om die installasie, 'n handige pakket te laai is Rcmdr, wat ontwikkel is deur John Fox. Rcmdr skep R spyskaarte wat spyskaarte in Excel kan word. Hierdie funksie kom by verstek met die RAndFriends installasie en maak 'n paar R beveel beskikbaar in Excel. Tik die volgende opdragte in R tot Rcmdr installeer. Ons kan die skakel na R en Excel te skep. Let onlangse weergawes van RExcel hierdie verband gemaak word met 'n eenvoudige dubbel-klik van die voorwaarde bat lêer ActivateRExcel2010, sodat jy net nodig sal hê om hierdie stappe te volg as jy met die hand geïnstalleer R en RExcel of vir een of ander rede die verband isnt gemaak tydens die RAndFriends installasie. Skep die verband tussen R en Excel Open 'n nuwe boek in Excel en gaan na die opsies skerm. Klik Options en dan Add-Ins. Jy moet 'n lys van al die aktiewe en onaktiewe add-ins wat jy tans het te sien. Klik op die knoppie Spring aan die onderkant. Op die dialoog Add-Ins boks, sal jy al die add-in verwysings wat jy gemaak het sien. Klik op Browse. Gaan na die gids RExcel, gewoonlik in C: Program FilesRExcelxls of iets soortgelyks. Vind die RExcel. xla add-in en klik dit. Die volgende stap is om 'n verwysing sodat makros met behulp van R om behoorlik te werk te skep. In jou Excel dokument, tik Alt F11. Dit sal uitblink VBA editor te bekom. Gaan na Tools - gt Verwysings en vind die RExcel verwysing, RExcelVBAlib. RExcel moet nou gereed om te gebruik Gebruik die Excel Sheet Noudat R en RExcel behoorlik gekonfigureer, sy tyd om te doen 'n paar voorspellings Maak die voorspelling vel en Klik op load-bediener. Dit is om die kamertemperatuur bediener begin en ook laai die nodige funksies na die voorspelling te doen. 'N dialoog sal oopmaak. Kies die itall. R lêer ingesluit met die vel. Die lêer bevat die funksies van die voorspelling instrument gebruik. Die meeste van die funksies wat is ontwikkel deur Professor Stoffer aan die Universiteit van Pittsburgh. Hulle brei die vermoëns van R en gee ons 'n paar nuttige diagnostiese grafieke saam met ons vooruitskatting uitset. Daar is ook 'n funksie om die beste pas parameters van die ARIMA model outomaties bepaal. Na afloop van die bediener vragte, gee jy jou data in die kolom Data. Kies die omvang van die data, regs-kliek en kies Naam Range. Noem die reeks as Data. Volgende, het die frekwensie van jou data in Cell C6. Frekwensie verwys na die tydperke van jou data. As dit is n weeklikse, sal die frekwensie 7. maandeliks sou 12 wees, terwyl sou kwartaallikse 4 wees, en so aan. Tik die tydperke voor te voorspel. Let daarop dat ARIMA modelle word baie onakkurate na 'n paar opeenvolgende frekwensie voorspellings. 'N Goeie reël is om nie 30 stappe as enigiets meer as verlede wat eerder onbetroubaar kan wees. Dit beteken afhang van die grootte van jou data sowel stel. As jy het 'n beperkte data beskikbaar is, word dit aanbeveel om 'n kleiner stappe te kies wat voorlê nommer. Na die begin van jou data, noem dit, en die opstel van die verlangde frekwensie en stappe vooruit te voorspel, kliek op Doen. Dit kan 'n rukkie neem vir die vooruitskatting te verwerk. Sodra sy voltooi, sal jy voorspelde waardes uit die getal wat u verskaf het, die standaardfout van die resultate, en twee kaarte. Die links is die voorspelde waardes geplot met die data, terwyl die reg bevat handige diagnoses met gestandaardiseerde residue, die outokorrelasie van die residue, 'n gg plot van die residue en 'n Ljung-Box statistieke grafiek om te bepaal of die model is goed toegerus. Ek gewoond raak in te veel detail oor hoe jy kyk vir 'n goed toegeruste model, maar op die ACF grafiek jy dit nie wil hê dat enige (of baie) van die lag are kruising oor die stippellyn blou lyn. Op die gg plot, hoe meer sirkels wat gaan deur die lyn, hoe meer genormaliseer en beter toegerus die model is. Vir groter datastelle kan dit 'n baie sirkels kruis. Laastens, die Ljung-Box toets is 'n artikel op sigself egter die meer sirkels wat bo die stippellyn blou lyn, hoe beter is die model is. As die diagnose lei nie die geval goed lyk, kan jy probeer die toevoeging van meer inligting of vanaf 'n ander punt nader aan die omvang jy wil hê om te voorspel. Jy kan maklik die gegenereerde resultate duidelik deur te kliek op die Helder Geskatte Waardes knoppies. En dis dit Tans is die datum kolom nie die geval is nie enigiets anders as vir jou verwysing, maar dit is nie nodig dat die instrument. As ek tyd kry, Ill gaan terug en voeg dit so die vertoon grafiek toon die korrekte tyd. Jy kan ook 'n fout ontvang wanneer loop die skatting. Dit is gewoonlik as gevolg van die funksie wat die beste parameters bevind is nie in staat om die korrekte volgorde te bepaal. Jy kan volg die bogenoemde stappe te probeer en jou data beter vir die funksie om te werk te reël. Ek hoop jy gebruik uit die instrument Sy het my gered genoeg tyd by die werk, soos nou al wat ek hoef te doen is tik die data, die bediener laai en voer dit uit. Ek hoop ook hierdie wys jou hoe ontsagwekkende R kan wees, veral wanneer dit gebruik word met 'n front-end soos Excel. Kode, Excel werkblad en. bas lêer is ook op GitHub hier. There is 'n aantal benaderings tot modellering tydreekse. Ons skets 'n paar van die mees algemene benaderings hieronder. Tendens, Seisoene, Residuele ontbindings Een benadering is om die tydreeks ontbind in 'n tendens, seisoenale en residuele komponent. Drie eksponensiële gladstryking is 'n voorbeeld van hierdie benadering. Nog 'n voorbeeld, die sogenaamde seisoenale loess, is gebaseer op plaaslik geweegde kleinste kwadrate en bespreek deur Cleveland (1993). Ons het nie seisoenale loess bespreek in hierdie handboek. Frekwensie-gebaseerde metodes Ander benadering, wat algemeen gebruik word in wetenskaplike en ingenieurstoepassings, is om die reeks in die frekwensiedomein te ontleed. 'N Voorbeeld van hierdie benadering in die modellering van 'n sinusvormige tipe datastel word in die bundel defleksie gevallestudie. Die spektrale plot is die primêre instrument vir die frekwensie tydreeksanalise. Outoregressiewe (AR) Models 'n gemeenskaplike benadering vir die modellering van eenveranderlike tydreekse is die outoregressiewe (AR) model: Xt delta phi1 X phi2 X cdots phip X By, waar (Xt) is die tydreeks, (at) is wit geraas, en delta verlaat (1 - som p phii regs) mu. met (mu) wat na die proses beteken. 'N outoregressiewe model is bloot 'n lineêre regressie van die huidige waarde van die reeks teen een of meer vorige waardes van die reeks. Die waarde van (p) is aan die orde van die AR model genoem. AR modelle ontleed kan word met een van verskeie metodes, insluitend standaard lineêre kleinste kwadrate tegnieke. Hulle het ook 'n eenvoudige interpretasie. Bewegende gemiddelde (MA) Models Nog 'n algemene benadering vir die modellering van eenveranderlike tydreekse modelle is die bewegende gemiddelde (MA) model: Xt mu Op - theta1 A - theta2 A - cdots - thetaq A, waar (Xt) is die tydreeks, (mu ) is die gemiddelde van die reeks, (a) wit geraas terme, en (theta1,, ldots,, thetaq) is die parameters van die model. Die waarde van (Q) is aan die orde van die MA-model genoem. Dit wil sê, 'n bewegende gemiddelde model is konseptueel 'n lineêre regressie van die huidige waarde van die reeks teen die wit geraas of ewekansige skokke van een of meer vorige waardes van die reeks. Die ewekansige skokke by elke punt word aanvaar dat die kom van dieselfde verspreiding, tipies 'n normaalverspreiding, met plek op nul en konstant skaal. Die onderskeid in hierdie model is dat hierdie ewekansige skokke is propogated om toekomstige waardes van die tyd reeks. Pas die MA skattings is meer ingewikkeld as met AR modelle omdat die fout terme is nie waarneembaar. Dit beteken dat iteratiewe nie-lineêre passing prosedures moet gebruik word in die plek van lineêre kleinste kwadrate. MA modelle het ook 'n minder voor die hand liggend interpretasie as AR modelle. Soms is die ACF en PACF sal stel voor dat 'n MA-model 'n beter model keuse en soms albei AR sou wees en MA terme gebruik moet word in dieselfde model (sien Afdeling 6.4.4.5). Let egter daarop dat die fout terme na die model is geskik moet onafhanklik wees en volg die standaard aannames vir 'n eenveranderlike proses. Box en Jenkins gewild 'n benadering wat die bewegende gemiddelde en die outoregressiewe benaderings in die boek Tydreeksanalise kombineer: Vooruitskatting en beheer (Box, Jenkins, en Reinsel, 1994). Alhoewel beide outoregressiewe en bewegende gemiddelde benaderings reeds bekend (en is oorspronklik ondersoek deur Yule), die bydrae van Box en Jenkins was in die ontwikkeling van 'n sistematiese metode vir die identifisering en die skatte van modelle wat beide benaderings kan inkorporeer. Dit maak Box-Jenkins modelle 'n kragtige klas modelle. Die volgende paar afdelings sal hierdie modelle in detail. One bespreek gebruikte voorstelling van 'n eenveranderlike tydreekse is 'n ARMA model. Om die model te motiveer, basies kan ons twee lyne van denke te spoor. Eerstens, 'n model hang af van die vlak van die gesloerde waarnemings. Byvoorbeeld, as ons 'n hoë verwesenliking van die BBP in ag te neem wat ons sou verwag dat die BBP in die volgende paar periodes hoog as well. Hierdie manier van dink kan voorgestel word deur 'n outoregressiewe model (AR model). 'N AR-model van die orde p kan geskryf word as: waar en Is 'n konstante In die tweede manier van dink, kan ons model wat die waarnemings van 'n ewekansige veranderlike op tydstip t is nie net beïnvloed deur die skok op tydstip t, maar ook die skokke van vorige tydperke. Byvoorbeeld, as ons 'n negatiewe skok sorgvuldig die ekonomie, sê, 9/11, dan sou ons verwag dat die negatiewe uitwerking invloed op die ekonomie ook vir die nabye toekoms. Hierdie manier van dink kan voorgestel word deur 'n bewegende gemiddelde model (MA model). 'N MA model van die orde q kan geskryf word as: As ons albei modelle kombineer kry ons 'n ARMA (p, q) model. 'N noodsaaklike voorwaarde van vir ARMA modelle is dat die ARMA Equitation 'n stilstaande oplossing. As die tyd reeks is nie stilstaande, kan ons dit te transformeer na 'n stilstaande tydreekse deur breukmetodes. ARMA modelle met differenced tydreekse geroep ARIMA (p, d, Q) (outoregressiewe geïntegreerde bewegende gemiddelde) modelle, waar d die aantal verskille 'n stilstaande tyd reeks kry. Die parameter van 'n suiwer AR (p) model kan geskat word deur OLS. Skatting van MA (q) of ARMA (p, q) modelle (met qgt1) is nie liniêr. web: Reg ARMA byvoeging In skattings hierdie modelle met behulp van die Levenberg-Marquardt algoritme. Die derivate, wat nodig is vir die beraming en die kovariansiematriks, word bereken met numeriese eindige verskil metodes. Na raming die add-in gee die koëffisiënt resultate (insluitend std. error, t-statistiek, p-waarde), opsommingstatistiek (Rsup2, Aangesuiwer Rsup2, standaardfout van regressie, som gekapte residue, teken waarskynlikheid, Durbin-Watson, Akaike inligting kriteria (AIC), Schwarz kriteria (SIC), omgekeerde MA / AR wortels, impulsrespons funksie sowel as voorspel evolusie. Alle skakels sal oop in 'n nuwe venster Wikipedia 'n beskrywing van die ARIMA modelle op Wikipedia. (HTML) Levenberg Marquard. Manolis IA Lourakis. n kort beskrywing van die Levenberg-Marquardt Algoritme Implemened deur levmar. (PDF) Skakels na ander terreine van hierdie bladsye is slegs ter inligting en Kurt Annen aanvaar geen verantwoordelikheid of aanspreeklikheid vir toegang tot, of die materiaal op , 'n webwerf wat geskakel is vanaf of na hierdie site vir die aflaai kliek op die lêernaam die web:. Reg ARMA byvoeging In geskryf deur Kurt Annen hierdie program is gratis, maar ek sou hoogs waardeer as jy my krediet kan gee my.. werk deur die verskaffing van my met inligting oor moontlike oop posisies as 'n ekonoom. My fokus as 'n ekonoom is op ekonometrie en dinamiese makro-ekonomie. As jy graag die program, stuur vir my 'n e-pos. ARMA Excel add-in

No comments:

Post a Comment