Centered moving average begrip




Centered moving average begripBij het berekenen van een bewegend bewegend gemiddelde, is het gemiddelde in de middellange periode zinvol. In het vorige voorbeeld berekenden we het gemiddelde van de eerste 3 tijdsperiodes en legden het naast periode 3. We hadden het gemiddelde in het midden van de Tijdsinterval van drie perioden, dat wil zeggen naast periode 2. Dit werkt goed met oneven tijdstippen, maar niet zo goed voor even periodes. Dus waar zouden we het eerste bewegende gemiddelde plaatsen als M 4 Technisch zou het bewegende gemiddelde vallen op t 2.5, 3.5. Om dit probleem te voorkomen vergemakkelijken we de MA's met M 2. Zo vergemakkelijken we de gladde waarden. Als we gemiddeld een even aantal termen hebben, moeten we de gladde waarden glad maken. De volgende tabel toont de resultaten met behulp van M 4.David, Yes, MapReduce is Bedoeld om te werken op een groot aantal gegevens. En het idee is dat in het algemeen de kaart en de functievermindering geen zorgen moeten maken over hoeveel mappers of hoeveel reducers er zijn, dat is gewoon optimalisatie. Als u zorgvuldig denkt over het algoritme dat ik heb geplaatst, kunt u zien dat het niet uitmaakt welke mapper welke delen van de gegevens krijgt. Elk invoer record zal beschikbaar zijn voor elke reducerende operatie die het nodig heeft. Ndash Joe K Sep 18 12 om 22:30 In het beste van mij is het bewegende gemiddelde geen goede kaarten voor MapReduce-paradigma, aangezien de berekening in wezen glanzende raam over gesorteerde gegevens schuift, terwijl MR de verwerking van niet-gecombineerde reeksen gesorteerd gegevens verwerkt. De oplossing die ik zie is als volgt: a) Aangepaste partitie implementeren om twee verschillende partities in twee runs te kunnen maken. In elke run krijgen uw reducers verschillende gegevensberekeningen en berekenen het bewegend gemiddelde, waar ik het goed wil proberen te illustreren. In de eerste stap moeten gegevens voor reductoren zijn: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier zal u een bewegend gemiddelde voor sommige Qs caclueren. In de volgende fase moeten uw reducers gegevens krijgen zoals: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 En cacluleer de rest van bewegende gemiddelden. Dan moet u de resultaten samenvoegen. Idee van aangepaste partitieer dat het twee manieren van operatie heeft - elke keer verdeeld in gelijke gebieden maar met een beetje verschuiving. In een pseudocode ziet het er zo uit. Partitie (keySHIFT) (MAXKEYnumOfPartitions) waar: SHIFT uit de configuratie zal worden genomen. Maximale waarde van de sleutel. Ik veronderstel voor de eenvoud dat ze met nul beginnen. RecordReader, IMHO is geen oplossing, omdat het beperkt is tot specifieke splitsing en niet over de splitsgrens kan glijden. Een andere oplossing zou zijn om aangepaste logica van splitsende invoergegevens uit te voeren (het is onderdeel van de InputFormat). Het kan gedaan worden om 2 verschillende dia's te doen, vergelijkbaar met het partitioneren. Antwoord 17 september 12 om 8: 59Verwaartsgemiddelden en Gecentreerde Bewegende Gemiddelden Een paar punten over seizoensgebondenheid in een tijdreeks, herhalen, ook al lijken ze voor de hand liggende. Een daarvan is dat de term 8220season8221 niet noodzakelijkerwijs naar de vier seizoenen van het jaar verwijst, die voortvloeit uit de kanteling van de A88217-as. In predictive analytics betekent 8220season8221 vaak dat precies omdat veel van de verschijnselen die we bestuderen wel afwijken van de voortgang van de lente door de winter: verkoop van winter - of zomeruitrusting, incidentie van bepaalde wijdverspreide aandoeningen, weersomstandigheden veroorzaakt door de locatie van de Straalstroom en veranderingen in de temperatuur van het water in de oostelijke Stille Oceaan, enzovoort. Even vaak kunnen gebeurtenissen die regelmatig optreden, als meteorologische seizoenen optreden, hoewel ze slechts een toffe verbinding hebben met de solstices en equinoxes. Acht uurverschuivingen in ziekenhuizen en fabrieken komen vaak voor in de aanwezigheid van inname en uitgaven van energie daar, een seizoen is acht uur lang en de seizoenen rennen elke dag, niet elke jaar. Betaaldatums voor belastingen betekenen het begin van een overstroming van dollars in gemeentelijke, staats - en federale schatkistjes, het seizoen kan een jaar lang zijn (persoonlijke inkomstenbelasting), zes maanden (onroerendgoedbelasting in veel staten), kwartaalbelasting (veel vennootschapsbelasting ), enzovoort. Het is een beetje vreemd dat we het woord 8220season8221 hebben om in het algemeen te verwijzen naar de regelmatig terugkerende tijdsperiode, maar geen algemene term voor de periode waarin een volledige sluiting van de seizoenen plaatsvindt. 8220Cycle8221 is mogelijk, maar bij analyse en voorspelling wordt gewoonlijk een term van onbepaalde duur, zoals een conjunctuurcyclus, gebruikt. In afwezigheid van een betere term, gebruikte I8217ve in deze en volgende hoofdstukken 8220omvattende periode8221. Dit is slechts een terminologische muzikatie. De manieren waarop we seizoenen identificeren en de periode waarin de seizoenen wisselen, hebben echt, als vaak minder, implicaties voor hoe we hun effecten meten. In de volgende paragrafen wordt besproken hoe sommige analisten de manier waarop ze gemiddelde gemiddelde verhoudingen berekenen afhankelijk zijn van of het aantal seizoenen oneven of gelijk is. Met behulp van bewegende gemiddelden In plaats van eenvoudige gemiddelden Stel dat een grote stad de overplaatsing van zijn verkeerspolitie overweegt om beter te gaan met de incidentie van het rijden, terwijl de stad is gedaald, die volgens de stad is toegenomen. Vier weken geleden is nieuwe wetgeving in werking getreden, waardoor het bezit en het recreatieve gebruik van marihuana wettelijk is gewettigd. Sindsdien lijkt het dagelijkse aantal verkeersarres voor DWI op te treden. Komplicerende zaken zijn het feit dat het aantal arrestaties op weekenden en zaterdagen toeneemt. Om in de toekomst te kunnen plannen voor de arbeidskrachtenbehoeften, wilt u de onderliggende trend die zich vestigt, voorspellen. You8217d houdt ook graag van de inzet van uw middelen om rekening te houden met elk weekend-gerelateerde seizoensgebondenheid dat er plaatsvindt. Figuur 5.9 heeft de relevante gegevens waarmee u moet werken. Figuur 5.9 Met deze dataset is elke dag van de week een seizoen. Zelfs door alleen de grafiek in figuur 5.9 te oogblazen. U kunt zien dat de trend van het aantal dagelijkse arrestaties op is. You8217ll moeten plannen om het aantal verkeersambtenaren uit te breiden, en hopen dat de trend snel afkomt. Verder blijkt uit de gegevens dat meer arrestaties routinematig op vrijdag en zaterdag plaatsvinden, dus bij uw toewijzing van hulpbronnen moet u die spikes aanpakken. Maar je moet de onderliggende trend kwantificeren, om te bepalen hoeveel extra politie je moet nemen. U moet ook de verwachte grootte van de weekendspikes berekenen, om te bepalen hoeveel extra politie u op die dagen moet kijken naar wisselvallige bestuurders. Het probleem is dat u nog steeds niet weet hoeveel van de dagelijkse stijging het gevolg is van de trend en hoeveel is het gevolg van dat weekend effect. U kunt beginnen met het afbreken van de tijdreeks. Vroeger in dit hoofdstuk, in 8220Simple Seizoensgemiddelden, 8221, zag je een voorbeeld van hoe je een tijdreeks afdoet om de seizoensgebonden effecten te isoleren met behulp van de methode van eenvoudige gemiddelden. In deze sectie ziet u8217ll hoe u dit doet met behulp van bewegende gemiddelden8212 Waarschijnlijk wordt de bewegende gemiddelden benadering vaak gebruikt in voorspellende analyses dan is de eenvoudige gemiddelde benadering. Er zijn verschillende redenen voor de grotere populariteit van bewegende gemiddelden, onder andere, dat de bewegende gemiddelden benadering u niet vraagt ??om uw gegevens in te slaan bij het kwantificeren van een trend. Herinneren dat in het vroegere voorbeeld het nodig was om kwartaalgemiddelden naar jaargemiddelden te verlagen, een jaarlijkse trend te berekenen en vervolgens een kwart van de jaarlijkse trend over elk kwartaal in het jaar te verdelen. Die stap was nodig om de trend van de seizoensgebonden effecten te verwijderen. In tegenstelling hiermee stelt de bewegende gemiddelden-aanpak u de tijdreeks in de gaten, zonder dat te bewerkstelligen. Figuur 5.10 laat zien hoe de bewegende gemiddeldenaanpak in dit voorbeeld werkt. Figuur 5.10 Het bewegende gemiddelde in de tweede grafiek verduidelijkt de onderliggende trend. Figuur 5.10 voegt een bewegende gemiddelde kolom toe en een kolom voor specifieke seizoenen. Naar de dataset in figuur 5.9. Beide toevoegingen hebben een aantal discussies nodig. De spikes in arrestaties die in het weekend plaatsvinden, geven u reden om te geloven dat u met de seizoenen werkt die een keer per week herhalen. Begin daarom met het gemiddelde voor de omtrekperiode8212, dat is de eerste zeven seizoenen, maandag tot en met zondag. De formule voor het gemiddelde in cel D5, het eerste beschikbare bewegende gemiddelde, is als volgt: Die formule wordt gekopieerd en geplakt via cel D29, dus u heeft 25 bewegende gemiddelden gebaseerd op 25 runs van zeven opeenvolgende dagen. Merk op dat om zowel de eerste als de laatste waarnemingen in de tijdreeksen te laten zien, ik de verborgen rijen 10 tot en met 17 heb. U kunt ze, in dit hoofdstuk8217 werkboek, op de website van publisher8217 onthullen. Maak een meervoudige selectie van zichtbare rijen 9 en 18, klik met de rechtermuisknop op een van de rijkopjes en kies Unhide in het snelmenu. Wanneer u een werkblad8217s rijen verbergt, zoals I8217ve gedaan in Figuur 5.10. Elke getekende data in de verborgen rijen is ook verborgen op de grafiek. De x-as labels identificeren alleen de gegevenspunten die op de grafiek verschijnen. Omdat elk bewegend gemiddelde in figuur 5.10 zeven dagen omvat, is geen bewegend gemiddelde gekoppeld aan de eerste drie of laatste drie werkelijke waarnemingen. Het kopieren en plakken van de formule in cel D5 omhoog op een dag naar cel D4 brengt u uit observaties8212. Er is geen waarneming opgenomen in cel C1. Evenzo is er geen bewegend gemiddelde opgenomen onder de cel D29. Het kopieren en plakken van de formule in D29 in D30 zou een waarneming nodig hebben in cel C33, en er is geen observatie beschikbaar voor de dag die de cel zou vertegenwoordigen. Het zou natuurlijk kunnen zijn om de lengte van het bewegende gemiddelde te verkorten, bijvoorbeeld vijf in plaats van zeven. Dat betekent dat de bewegende gemiddelde formules in Figuur 5.10 in cel D4 kunnen beginnen in plaats van D5. In deze soort analyse wil je echter dat de lengte van het bewegende gemiddelde gelijk is aan het aantal seizoenen: zeven dagen per week voor gebeurtenissen die wekelijks terugkomen, impliceert een bewegend gemiddelde van lengte zeven en vier kwartalen in een jaar voor gebeurtenissen die Herhalen jaarlijks impliceert een bewegend gemiddelde van lengte vier. Langs dezelfde lijnen, kwantificeren we over het algemeen seizoensgebonden effecten op een zodanige manier dat ze in de overeengekomen periode tot nul komen. Zoals u in dit hoofdstuk8217s eerste deel hebt gezien, op eenvoudige gemiddelden, wordt dit gedaan door het gemiddelde van (zeggen) de vier kwartalen in een jaar te berekenen en vervolgens het gemiddelde voor het jaar uit elk kwartaalgetal af te trekken. Zo wordt ervoor gezorgd dat het totaal van de seizoensgebonden effecten nul is. Op zijn beurt zijn that8217s nuttig omdat het seizoensgebonden effecten op een gemeenschappelijk footing8212a zomer effect van 11 is, zo ver van het gemiddelde als een winter effect van 821111. Als u gemiddeld vijf seizoenen in plaats van zeven wilt hebben om uw bewegende gemiddelde te krijgen, bent u beter Uit het vinden van een fenomeen dat elke vijf seizoenen herhaalt in plaats van elke zeven. Wanneer u het gemiddelde van de seizoensgebonden effecten later in het proces neemt, zullen deze gemiddelden onwaarschijnlijk op nul komen. It8217s nodig om op dat punt te kalibreren of te normaliseren. De gemiddelden zodat hun som nul is. Als die gemiddelde seizoensgemiddelden zijn afgerond, worden de effecten uitgedrukt in een periode van behoren tot een bepaald seizoen. Eenmaal genormaliseerd worden de seizoensgemiddelden de seizoensindexen genoemd die dit hoofdstuk al meerdere malen heeft genoemd. You8217ll zie hoe het later in dit hoofdstuk werkt, in 8220De reeks verplaatsen met bewegende gemiddelden.8221 Begrip specifieke seizoensgebonden Figuur 5.10 laat ook zien wat specifieke seizoenen in kolom E. Zij zijn wat8217s vertrokken nadat het bewegende gemiddelde afgetrokken is van de feitelijke waarneming. Om een ??gevoel te krijgen van wat de specifieke seizoenen vertegenwoordigen, beschouw het bewegende gemiddelde in cel D5. Het is het gemiddelde van de waarnemingen in C2: C8. De afwijkingen van elke observatie van het bewegende gemiddelde (bijvoorbeeld C2 8211 D5) worden gegarandeerd tot een waarde van nul8212that8217s, een kenmerk van een gemiddelde. Daarom weerspiegelt elke afwijking het effect dat zij in die bepaalde week in verband staan ??met die bepaalde dag. It8217 is een specifieke seizoensgebonden, dan8212specifieke omdat de afwijking van toepassing is op die bepaalde maandag of dinsdag, enzovoort, en seizoensgebonden omdat in dit voorbeeld we82 elke dag behandelen alsof het een seizoen was in de omtrekperiode van een week. Omdat elke specifieke seizoensgebonden maatregel het effect van dat seizoen is, 224-vis het bewegende gemiddelde voor deze groep van (hier) zeven seizoenen, kunt u vervolgens de specifieke seizoenen voor een bepaald seizoen (bijvoorbeeld alle vrijdagen in uw Tijdreeksen) om dat seizoen8217s algemeen te beoordelen, in plaats van specifiek, effect. Dat gemiddelde wordt niet verstoord door een onderliggende trend in de tijdreeksen, omdat elk seizoensgebonden seizoen een afwijking uitmaakt van zijn eigen bewegende gemiddelde. Alignment van de bewegende gemiddelden There8217s ook de kwestie van het aanpassen van de bewegende gemiddelden met de oorspronkelijke dataset. In figuur 5.10. Ik heb elk bewegend gemiddelde uitgelijnd met het middelpunt van de reeks observaties die het bevat. Zo bijvoorbeeld, de formule in cel D5 gemiddeld de waarnemingen in C2: C8 en ik heb het met de vierde waarneming, het middelpunt van het gemiddelde bereik, in lijn gebracht door deze in rij 5 te plaatsen. Deze regeling wordt aangeduid als een centraal bewegend gemiddelde . En veel analisten verkiezen het verloop van elk bewegend gemiddelde met het middelpunt van de waarnemingen die het gemiddelden. Houd er rekening mee dat in deze context 8220midpoint8221 betrekking heeft op het midden van een tijdsperiode: donderdag is het middelpunt van maandag tot en met zondag. Het verwijst niet naar de mediaan van de waargenomen waarden, hoewel het in de praktijk natuurlijk kan uitwerken. Een andere aanpak is het achterliggende bewegende gemiddelde. In dat geval is elk bewegend gemiddelde in lijn met de laatste observatie dat het gemiddeld is en dat het daarom achter de argumenten loopt. Dit is vaak de voorkeurskader als u een bewegend gemiddelde wilt gebruiken als een prognose, zoals met exponentiele uitlijning gedaan, omdat uw laatste bewegende gemiddelde samenvalt met de laatste beschikbare observatie. Gecentreerde Bewegende Gemiddelden Met Even Aantal Seizoenen Wij nemen gewoonlijk een speciale procedure aan wanneer het aantal seizoenen zelfs in plaats van vreemd is. Dat is de typische stand van zaken: er zijn even seizoenen in de omtrekperiode voor typische seizoenen, zoals maanden, kwartalen en vierjaarlijkse periodes (voor verkiezingen). De moeilijkheid met een even aantal seizoenen is dat er geen middelpunt is. Twee is niet het middelpunt van een reeks vanaf 1 en eindigt op 4, en ook 3 is niet als men kan zeggen dat het middelpunt 2,5 is. Zes is niet het middelpunt van 1 tot 12, en ook niet 7 is zijn puur theoretisch middenpunt is 6,5. Om te fungeren alsof er een middelpunt bestaat, moet u een gemiddelde laag op de bewegende gemiddelden toevoegen. Zie figuur 5.11. Figuur 5.11 Excel biedt verschillende manieren om een ??centraal bewegend gemiddelde te berekenen. Het idee achter deze aanpak om een ??bewegend gemiddelde te krijgen dat 8217 centraal staat op een bestaand middenpunt, wanneer er een even aantal seizoenen is, is dat middelpunt vooruit te trekken met een half seizoen. U berekent een bewegend gemiddelde dat zou worden gecentreerd bij, bijvoorbeeld, het derde punt in de tijd als vijf seizoenen in plaats van vier een volledige draai van de kalender vormden. Dat is gedaan door twee opeenvolgende bewegende gemiddelden te nemen en om ze te gemiddelde. Dus in figuur 5.11. There8217s is een bewegend gemiddelde in cel E6 die de waarden in D3: D9 gemiddelden. Omdat er vier seizoenswaarden in D3 zijn: D9, wordt het bewegende gemiddelde in E6 beschouwd als gecentreerd in het denkbeeldige seizoen 2,5, een halve punt kort van het eerste beschikbare kandidaat seizoen 3. (Seizoenen 1 en 2 zijn niet beschikbaar als middelpunten voor Gebrek aan gegevens tot gemiddeld voor seizoen 1.) Let wel dat het bewegende gemiddelde in cel E8 de waarden in D5: D11, de tweede door de vijfde in de tijdreeks gemiddelden, gemeten wordt. Dat gemiddelde is geconcentreerd op (denkbeeldig) punt 3.5, een volledige periode voor het gemiddelde dat op 2,5 wordt gecentreerd. Door de twee bewegende gemiddelden te vermenigvuldigen, zodat het denken gaat, kunt u het middelpunt van het eerste bewegende gemiddelde naar voren trekken met een halve punt, van 2,5 tot 3. Dat is wat de gemiddelden in kolom F van figuur 5.11 doen. Cell F7 geeft het gemiddelde van de bewegende gemiddelden in E6 en E8. En het gemiddelde in F7 is afgestemd op het derde data punt in de oorspronkelijke tijdreeks, in cel D7, om te benadrukken dat het gemiddelde op dat seizoen is geconcentreerd. Als u de formule in cel F7 uitbreidt, evenals de bewegende gemiddelden in cellen E6 en E8, ziet u8217ll dat het een gewogen gemiddelde van de eerste vijf waarden in de tijdreeks is, waarbij de eerste en vijfde waarde een gewicht geven Van 1, en de tweede door vierde waarden een gewicht van 2 geven. Dat leidt ons tot een snellere en eenvoudiger manier om een ??centraal bewegend gemiddelde met een even aantal seizoenen te berekenen. Nog steeds in figuur 5.11. De gewichten worden opgeslagen in het bereik H3: H11. Deze formule geeft het eerste gecentreerde bewegende gemiddelde terug, in cel I7: die formule retourneert 13.75. Die identiek is aan de waarde berekend door de dubbelgemiddelde formule in cel F7. De verwijzing naar de gewichten absolute, door middel van de dollartekens in H3: H11. U kunt de formule kopieren en plakken voor zover nodig om de rest van de gecentreerde bewegende gemiddelden te krijgen. De serie met bewegende gemiddelden afronden Als u de bewegende gemiddelden van de oorspronkelijke waarnemingen hebt getrokken om de specifieke seizoenen te krijgen, heeft u de onderliggende trend van de serie verwijderd. Wat8217s in de specifieke seizoenen achterblijft is normaal gesproken een stationaire, horizontale serie met twee effecten die ervoor zorgen dat de specifieke seizoenen van een absoluut rechte lijn afwijken: de seizoensgebonden effecten en de willekeurige fout in de oorspronkelijke waarnemingen. Figuur 5.12 toont de resultaten voor dit voorbeeld. Figuur 5.12 De specifieke seizoensgebonden effecten voor vrijdag en zaterdag blijven duidelijk in de afgedankte serie. De bovenste grafiek in figuur 5.12 toont de oorspronkelijke dagelijkse waarnemingen. Zowel de algemene opwaartse trend als het weekend seizoenspieken zijn duidelijk. De onderste grafiek geeft de specifieke seizoenen weer: het resultaat van het afbreken van de originele serie met een bewegend gemiddelde filter, zoals eerder beschreven in 8220Verzetting van specifieke seizoensgebonden seizoenen.8221 U kunt zien dat de afgekeurde serie nu bijna horizontaal is (een lineaire trendlijn voor de specifieke seizoenen Heeft een lichte afwaartse drift), maar de seizoensgebonden vrijdag en zaterdag spikes zijn nog steeds in de plaats. De volgende stap is om verder te gaan dan de specifieke seizoenen naar de seizoensindexen. Zie figuur 5.13. Figuur 5.13 De specifieke seizoensgebonden effecten worden voor het eerst gemeten en vervolgens genormaliseerd om de seizoensindex te bereiken. In figuur 5.13. De specifieke seizoenen in kolom E worden herschikt in de tabelvorm in het bereik H4: N7. Het doel is simpelweg het makkelijker maken om de seizoensgemiddelden te berekenen. Deze gemiddelden worden weergegeven in H11: N11. Echter, de cijfers in H11: N11 zijn gemiddelden, niet afwijkingen van een gemiddelde, en daarom kunnen we van hen verwacht dat ze nul bedragen. We moeten ze nog aanpassen zodat ze afwijkingen van een groot gemeen uitdrukken. Dat grote gemiddelde verschijnt in cel N13, en is het gemiddelde van de seizoensgemiddelden. We kunnen aankomen bij de seizoensindexen door het grote gemiddelde in N13 af te trekken van elk van de seizoensgemiddelden. Het resultaat is in het bereik H17: N17. Deze seizoensindexen zijn niet meer specifiek voor een bepaald bewegend gemiddelde, zoals het geval is met de specifieke seizoenen in kolom E. Omdat ze gebaseerd zijn op een gemiddelde van elk geval van een bepaald seizoen, drukken ze het gemiddelde effect van een bepaald seizoen over de Vier weken in de tijdreeksen. Bovendien zijn ze maatregelen van een seizoen8217s8212hier, een dag8217s8212effect op verkeersarrestaties vis-224-het gemiddelde voor een zeven dagen periode. We kunnen nu die seizoensindex gebruiken om de serie te ontzetten. We8217ll maken gebruik van de deseasonalized serie om prognoses te krijgen door middel van lineaire regressie of Holt8217s methode van gladde trended series (besproken in hoofdstuk 4). Vervolgens voegen we de seizoensindexen weer in de prognoses toe om ze opnieuw te herstellen. Dit alles verschijnt in figuur 5.14. Figuur 5.14 Nadat u de seizoensindexen hebt, zijn de afwerking zoals hier toegepast, hetzelfde als in de methode van eenvoudige gemiddelden. De stappen die in Figuur 5.14 zijn geillustreerd zijn grotendeels dezelfde als die in Figuur 5.6 en 5.7. Besproken in de volgende secties. De observaties aanpassen De seizoensindexen aftrekken van de oorspronkelijke observaties om de gegevens te ontbinden. U kunt dit doen zoals weergegeven in Figuur 5.14. Waarin de oorspronkelijke waarnemingen en de seizoensindexen worden geregeld als twee lijsten die in dezelfde rij beginnen, kolommen C en F. Deze regeling maakt het een beetje makkelijker om de berekeningen te structureren. U kunt ook de aftrekking doen zoals weergegeven in figuur 5.6. Waarin de oorspronkelijke kwartaalwaarnemingen (C12: F16), de kwartaalindexen (C8: F8) en de deseasonalized results (C20: F24) in tabelvorm worden weergegeven. Deze regeling maakt het een beetje makkelijker om zich te concentreren op de seizoensindexen en de kwartaalbladen. Voorspelling van de Deseasonalized Observations In Figuur 5.14. De opgemaakte waarnemingen zijn in kolom H en in Figuur 5.7 zijn ze8217 in kolom C. Ongeacht of u een regressiebenadering of een gladde benadering van de prognose wilt gebruiken, is het het best om de deseasonalized waarnemingen in een kolomlijst te regelen. In figuur 5.14. De prognoses staan ??in kolom J. De volgende array formule wordt ingevoerd in het bereik J2: J32. Vroeger in dit hoofdstuk heb ik erop gewezen dat als u het argument x-waarden uit de TREND () function8217s-argumenten weglaat, levert Excel de standaardwaarden 1. 2. N. Waar n het aantal y-waarden is. In de precieze formule, bevat H2: H32 31 y-waarden. Omdat het argument dat normaal gesproken de x-waarden bevat, ontbreekt, levert Excel de standaardwaarden 1. 2. 31. Dat zijn de waarden die we in elk geval willen gebruiken, in kolom B, dus de formule zoals gegeven is gelijk aan TREND (H2: H32, B2: B32). En dat is de structuur die wordt gebruikt in D5: D24 van Figuur 5.7: De vooruitzichtsvoorspelling maken Tot nu toe heeft u voorspellingen van de deseasonaliseerde tijdreeksen van t 1 t / m 31 in figuur 5.14 geregeld. En van t1 tot t20 in figuur 5.7. Deze prognoses vormen nuttige informatie voor verschillende doeleinden, waaronder het beoordelen van de nauwkeurigheid van de prognoses door middel van een RMSE-analyse. Maar uw voornaamste doel is tenminste de volgende, nog onopgeloste tijdsperiode te voorspellen. Om dat te kunnen krijgen, zou je eerst kunnen voorspellen uit de functie TREND () of LINEST () als u regressie gebruikt of vanuit de exponentiele smoothingformule als u de methode Holt8217 gebruikt. Vervolgens kunt u de bijbehorende seizoensindex bij de regressie of gladde prognose toevoegen, om een ??voorspelling te krijgen die zowel de trend als het seizoensgebonden effect omvat. In figuur 5.14. Je krijgt de regressievoorspelling in cel J33 met deze formule: In deze formule zijn de y-waarden in H2: H32 hetzelfde als in de andere TREND () formules in kolom J. Zo zijn de (standaard) x-waarden van 1 Door 32. Nu levert u echter een nieuwe x-waarde als het derde argument van de functie8217, waar u TREND () in cel B33 voor uitzoekt. It8217s 32. De volgende waarde van t. En Excel retourneert de waarde 156.3 in cel J33. De functie TREND () in cel J33 vertelt Excel, in feite 8220Requireer de regressievergelijking voor de waarden in H2: H32 teruggetrokken op de t-waarden 1 tot en met 31. Breng die regressievergelijking aan op de nieuwe x-waarde van 32 en retourneer het resultaat.8221 You8217ll vind dezelfde aanpak in cel D25 van figuur 5.7. Waar de formule om de one-step-ahead voorspelling te krijgen is dit: Het toevoegen van de seizoensgebonden indexen Terug In de laatste stap is het prognose resseasonaliseren door de seizoensindexes toe te voegen aan de trendprognoses, omkeren wat u vier stappen terug hebt gedaan als u de Indexen uit de oorspronkelijke waarnemingen. Dit gebeurt in kolom F in figuur 5.7 en kolom K in figuur 5.14. Don8217t vergeet de juiste seizoensindex voor de one-step-voorspelling toe te voegen, met de resultaten weergegeven in cel F25 in Figuur 5.7 en in cel K33 in Figuur 5.14. (I8217ve schaduwde de one-step-ahead cellen in zowel Figuur 5.7 als Figuur 5.14 om de prognoses te markeren.) U kunt grafieken vinden van drie representaties van de verkeersarrestgegevens in Figuur 5.15. De deseasonalized serie, de lineaire voorspelling van de deseasonalized data, en de reseasonalized prognoses. Merk op dat de prognoses zowel de algemene trend van de oorspronkelijke gegevens als de FridaySaturday spikes bevatten. Figuur 5.15 Grafieken van de prognoses.6.2 Gemiddelden ma 40 elecsales, order 5 41 In de tweede kolom van deze tabel wordt een bewegend gemiddelde van order 5 getoond, met een schatting van de trendcyclus. De eerste waarde in deze kolom is het gemiddelde van de eerste vijf waarnemingen (1989-1993). De tweede waarde in de 5-MA kolom is het gemiddelde van de waarden 1990-1994 enzovoort. Elke waarde in de 5-MA kolom is het gemiddelde van de waarnemingen in de periode van vijf jaar die op het overeenkomstige jaar wordt gecentreerd. Er zijn geen waarden voor de eerste twee jaar of de laatste twee jaar omdat we niet aan beide zijden twee opmerkingen hebben. In de formule hierboven bevat kolom 5-MA de waarden van de hoed met k2. Om te zien wat de trendcyclus schatting lijkt, plannen we het samen met de originele gegevens in Figuur 6.7. Plot 40 elecsales, voornaamste cijfers voor de verkoop van elektriciteitsproducten, ylab quotGWhquot. Xlab quotYearquot 41 lijnen 40 ma 40 elecsales, 5 41. col quotredquot 41 Let op hoe de trend (in het rood) gladder is dan de oorspronkelijke data en de belangrijkste beweging van de tijdreeks vastlegt zonder alle kleine schommelingen. De bewegende gemiddelde methode laat geen schattingen toe van T waar t dicht bij de uiteinden van de serie ligt, dus de rode lijn strekt zich niet uit tot de randen van de grafiek aan weerszijden. Later gebruiken we meer geavanceerde methoden van trendcyclus schatting die schattingen in de buurt van de eindpunten mogelijk maken. De volgorde van het bewegende gemiddelde bepaalt de gladheid van de trendcyclus schatting. In het algemeen betekent een grotere bestelling een gladdere curve. De volgende grafiek geeft het effect weer van het veranderen van de volgorde van het bewegend gemiddelde voor de elektriciteitsverkoopgegevens. Eenvoudige bewegende gemiddelden zoals deze zijn meestal van oneven orde (bijvoorbeeld 3, 5, 7, enz.) Dit zijn dus ze zijn symmetrisch: in een bewegend gemiddelde van orde m2k1 zijn er k vroegere waarnemingen, k later waarnemingen en de middelste waarneming Die gemiddeld zijn. Maar als m even was, zou het niet meer symmetrisch zijn. Bewegende gemiddelden van bewegende gemiddelden Het is mogelijk om een ??bewegend gemiddelde naar een bewegend gemiddelde toe te passen. Een reden hiervoor is het maken van een even-order bewegende gemiddelde symmetrische. We kunnen bijvoorbeeld een bewegend gemiddelde van bestelling 4 nemen en vervolgens een ander bewegend gemiddelde van bestelling 2 toepassen op de resultaten. In tabel 6.2 is dit gedaan voor de eerste paar jaar van de Australische kwartaalbierproductiegegevens. Beer2 lt - window 40 ausbeer, begin 1992 41 ma4 lt 40 beer2, bestelling 4. centrum FALSE 41 ma2x4 lt - 40 40 beer2, bestelling 4. centrum TRUE 41 De notatie 2times4-MA in de laatste kolom betekent een 4-MA Gevolgd door een 2-MA. De waarden in de laatste kolom worden verkregen door een bewegend gemiddelde van bestelling 2 van de waarden in de vorige kolom te nemen. Bijvoorbeeld, de eerste twee waarden in de 4-MA kolom zijn 451,2 (443410420532) 4 en 448,8 (410420532433) 4. De eerste waarde in de kolom 2times4-MA is het gemiddelde van deze twee: 450,0 (451.2448.8) 2. Wanneer een 2-MA een bewegend gemiddelde van evenveel volgorde (zoals 4) volgt, wordt het een centraal bewegend gemiddelde van orde 4 genoemd. Dit komt doordat de resultaten nu symmetrisch zijn. Om te zien dat dit het geval is, kunnen we de 2times4-MA als volgt schrijven: begin met de versterker Bigfrac (y y y y) frac (y y y y) Big amp frac y frac14y frac14y frac14y frac18y. Einde Het is nu een gewogen gemiddelde van waarnemingen, maar het is symmetrisch. Andere combinaties van bewegende gemiddelden zijn ook mogelijk. Bijvoorbeeld wordt een 3times3-MA vaak gebruikt en bestaat uit een bewegend gemiddelde van order 3 gevolgd door een ander bewegend gemiddelde van order 3. In het algemeen moet een evenorde MA gevolgd worden door een evenorde MA om het symmetrisch te maken. Evenzo moet een oneven bestelling MA gevolgd worden door een vreemde order MA. De trendcyclus met seizoensgegevens berekenen Het meest voorkomende gebruik van gemiddelde bewegende gemiddelden is het schatten van de trendcyclus van seizoensgebonden data. Beschouw de 2times4-MA: hat frac y frac14y frac14y frac14y frac18y. Bij toepassing op kwartaalgegevens wordt elk kwartaal gelijk gelegd aangezien de eerste en laatste voorwaarden in hetzelfde kwartaal in opeenvolgende jaren van toepassing zijn. Bijgevolg wordt de seizoensvariatie gemiddeld gemeten en de resulterende waarden van hoed t zullen weinig of geen seizoensvariant overblijven. Een vergelijkbaar effect zou verkregen worden met behulp van een 2x8-MA of 2x12-MA. In het algemeen is een 2-maal m-MA equivalent aan een gewogen bewegend gemiddelde van orde m1 met alle waarnemingen die 1m bedragen, behalve voor de eerste en laatste termen die gewichten 1 (2m) nemen. Dus als de seizoensperiode even en van de orde is m, gebruik dan een 2x m-MA om de trendcyclus te schatten. Als de seizoensperiode oneven is en van orde m, gebruik dan een m-MA om de trendcyclus te schatten. In het bijzonder kan een 2x12-MA gebruikt worden om de trendcyclus van maandelijkse data te schatten en een 7-MA kan worden gebruikt om de trendcyclus van de dagelijkse data te schatten. Andere keuzes voor de volgorde van de MA zullen meestal resulteren in trendcyclus schattingen die door de seizoensgebondenheid in de gegevens worden besmet. Voorbeeld 6.2 Elektrische apparatuur productie Figuur 6.9 toont een 2times12-MA toegepast op de besturingsindex van de elektrische apparatuur. Merk op dat de gladde lijn geen seizoensgebondenheid heeft, het is bijna hetzelfde als de trendcyclus in Figuur 6.2, die werd geschat met een veel meer verfijnde methode dan bewegende gemiddelden. Elke andere keuze voor de volgorde van het bewegende gemiddelde (behalve 24, 36, enz.) Zou hebben geleid tot een soepele lijn die sommige seizoensschommelingen laat zien. Plot 40 elecequip, ylab quotNew orders indexquot. Col quotgrayquot, hoofdproductieproductie van de elektrische apparatuur (eurogebied) quot 41 lijnen 40 ma 40 elecequip, order 12 41. col quotedquot 41 Gewogen bewegende gemiddelden Combinaties van bewegende gemiddelden resulteren in gewogen bewegende gemiddelden. Bijvoorbeeld, de hierboven beschreven 2x4-MA is gelijk aan een gewogen 5-MA met gewichten gegeven door frac, frac, frac, frac, frac. In het algemeen kan een gewogen m-MA geschreven worden als hoed t sum k aj y, waar k (m-1) 2 en de gewichten worden gegeven door a, dots, ak. Het is belangrijk dat de gewichten allemaal samenkomen en dat ze symmetrisch zijn, zodat aj a. De eenvoudige m-MA is een speciaal geval waar alle gewichten gelijk zijn aan 1m. Een belangrijk voordeel van gewogen bewegende gemiddelden is dat ze een gladere schatting geven van de trendcyclus. In plaats van observaties die de berekening volkomen inkomen en verlaten, worden hun gewichten langzaam verhoogd en vervolgens langzaam afgenomen, wat resulteert in een gladdere curve. Enkele specifieke sets gewichten worden op grote schaal gebruikt. Sommige van deze worden gegeven in tabel 6.3.