Tuesday 21 November 2017

Flytting Gjennomsnitt Stata Eksemplet


Flytte gjennomsnitt. Gjennomgang av gjennomsnitt. Med konvensjonelle datasett er gjennomsnittsverdien ofte den første, og en av de mest nyttige, sammendragsstatistikkene for å beregne Når data er i form av en tidsserie, er seriemengden et nyttig mål, men ikke gjenspeiler dataens dynamiske natur Gjennomsnittlige verdier beregnet over korte tidsperioder, som enten foregår i den nåværende perioden eller sentrert i den nåværende perioden, er ofte mer nyttige. Fordi slike middelverdier vil variere eller bevege seg, da den nåværende perioden beveger seg fra tid t 2, t 3 osv. de er kjent som bevegelige gjennomsnitt. Mas Et enkelt glidende gjennomsnitt er typisk det uveide gjennomsnittet av k-tidligere verdier. Et eksponentielt vektet glidende gjennomsnitt er i det vesentlige det samme som et enkelt glidende gjennomsnitt, men med bidrag til middelvektet av deres nærhet til Nåværende tid Fordi det ikke er en, men en hel rekke bevegelige gjennomsnittsverdier for en gitt serie, kan settet Mas selv bli tegnet på grafer, analysert som en serie, og benyttet i modellering og forec asting En rekke modeller kan bygges ved hjelp av bevegelige gjennomsnitt, og disse kalles MA-modeller. Hvis slike modeller kombineres med autoregressive AR-modeller, er de resulterende komposittmodellene kjent som ARMA eller ARIMA-modeller, som jeg er for integrert. en tidsserie kan betraktes som et sett med verdier, t 1,2,3,4, n gjennomsnittet av disse verdiene kan beregnes Hvis vi antar at n er ganske stor, og vi velger et heltall k som er mye mindre enn n kan vi beregne et sett med blokk gjennomsnitt eller enkle bevegelige gjennomsnitt av rekkefølge k. Hver måling representerer gjennomsnittet av dataverdiene over et intervall av k observasjoner. Merk at den første mulige MA i rekkefølge k 0 er det for tk Mer generelt vi kan slippe det ekstra abonnementet i uttrykkene ovenfor og skrive. Dette sier at estimert gjennomsnitt på tidspunktet t er det enkle gjennomsnittet av den observerte verdien ved tidspunktet t og de foregående k -1-trinns trinnene. Hvis det legges vekt på som reduserer bidraget fra observasjoner som er lenger bort i tid, sies det glidende gjennomsnittet å være eksponensielt jevnt. Flytende gjennomsnitt blir ofte brukt som en form for prognoser, hvorved estimert verdi for en serie på tid t 1, S t 1 blir tatt som MA for perioden opp til og inklusiv tid teg dagens estimat er basert på et gjennomsnitt av tidligere registrerte verdier fram til og med igår s for daglige data. Enkelte glidende gjennomsnitt kan sees som en form for utjevning I eksemplet som er vist nedenfor, vises luftforurensningsdatasettet vist i introduksjon til dette emnet har blitt forsterket av en 7-dagers glidende gjennomsnittlig MA-linje, vist her i rødt. Som det kan sees, jevner MA-linjen ut toppene og troughene i dataene og kan være svært nyttig for å identifisere trender. Standard forward - Beregningsformel betyr at de første k -1 datapunktene ikke har noen MA-verdi, men deretter utvider beregningene til det endelige datapunktet i serien. PM10 daglige gjennomsnittsverdier, Greenwich. source London Air Quality Network. One grunnen til beregning gjør det enkelt å flytte en veraser på den beskrevne måte er at det muliggjør beregning av verdier for alle tidsluker fra tid tk frem til i dag, og som en ny måling oppnås for tid t 1, kan MA for tid t 1 legges til settet allerede beregnet Dette gir en enkel prosedyre for dynamiske datasett. Det er imidlertid noen problemer med denne tilnærmingen. Det er rimelig å argumentere for at gjennomsnittverdien i løpet av de siste 3 periodene, for eksempel, burde ligge på tidspunktet t -1, ikke tiden t og for en MA over et jevnt antall perioder, kanskje det burde ligge midt mellom to tidsintervall. En løsning på dette problemet er å bruke sentrale MA-beregninger, hvor MA på tidspunktet t er gjennomsnittet av et symmetrisk sett med verdier rundt t Til tross for sine åpenbare verdier, er denne tilnærmingen ikke vanligvis brukt fordi det krever at data er tilgjengelig for fremtidige hendelser, noe som kanskje ikke er tilfelle. I tilfeller der analysen er helt av en eksisterende serie, kan bruk av sentrert Mas foretrekkes. Flytte gjennomsnitt kan regnes som en form for utjevning, fjerner noen høyfrekvente komponenter i en tidsserie og markerer, men fjerner ikke trender på samme måte som det generelle begrepet digital filtrering. Faktisk er glidende gjennomsnitt en form for lineært filter. Det er mulig å anvende en Flytte gjennomsnittlig beregning til en serie som allerede har blitt glattet, dvs. utjevning eller filtrering av en allerede glatt serie. For eksempel med et glidende gjennomsnitt på rekkefølge 2, kan vi betrakte det som beregnet ved hjelp av vekter, slik at MA ved x 2 0 5 x 1 0 5 x 2 På samme måte har MA ved x 3 0 5 x 2 0 5 x 3 Hvis vi bruker et andre nivå av utjevning eller filtrering, har vi 0 5 x 2 0 5 x 3 0 5 0 5 x 1 0 5 x 2 0 5 0 5 x 2 0 5 x 3 0 25 x 1 0 5 x 2 0 25 x 3 dvs. 2-trinns filtreringsprosessen eller konvolusjonen har produsert et variabelt vektet symmetrisk glidende gjennomsnitt, med vekter Flere konvolutter kan produsere ganske komplisert vektet Flytende gjennomsnitt, hvorav noen har blitt funnet av særlig bruk i spesialiserte felt, som i livet jeg nsurance beregninger. Gjennomsnittlige gjennomsnitt kan brukes til å fjerne periodiske effekter hvis beregnet med periodikkets lengde som kjent. For eksempel kan månedlige data sesongvariasjoner ofte fjernes hvis dette er målet ved å bruke et symmetrisk 12-måneders glidende gjennomsnitt med alle måneder vektet likt, bortsett fra det første og det siste som er vektet av 1 2 Dette skyldes at det vil være 13 måneder i den symmetriske modellen nåværende tid, t - 6 måneder Summen er delt med 12 Lignende prosedyrer kan vedtas for alle velkjente definert periodicitet. Eksponentielt vektet glidende gjennomsnitt EWMA. Med den enkle glidende gjennomsnittsformelen. alle observasjoner er likevektede. Hvis vi kalte disse likevektene, ville hver av k-vektene være 1 k slik at summen av vektene ville være 1 og formelen ville være. Vi har allerede sett at flere applikasjoner av denne prosessen resulterer i vektene varierende. Med eksponentielt vektet glidende gjennomsnitt blir bidraget til middelverdien fra observasjoner som er mer fjernet i tid, er overvekt redusert, og derved legger vekt på nyere lokale hendelser. I hovedsak er en utjevningsparameter, 0 1 innført, og formelen revidert til. En symmetrisk versjon av denne formelen ville være av formen. Hvis vektene i symmetrisk modellen er valgt som vilkårene for betingelsene i binomial utvidelsen, 1 2 1 2 2q de vil summe til 1, og som q blir stor, vil omtrentliggjøre normalfordelingen Dette er en form for kjernevikting, med binomialet som fungerer som kjernefunksjon Den tofasede konvolusjonen beskrevet i forrige avsnitt er nettopp dette arrangementet med q 1, som gir vekter. Ved eksponensiell utjevning er det nødvendig å bruke et sett med vekter som summen til 1 og som reduserer størrelsen geometrisk. Vektene som brukes er typisk for skjemaet. For å vise at disse vektene summerer til 1, vurder utvidelsen av 1 som en serie Vi kan skrive. og utvide uttrykket i parentes ved hjelp av binomialformelen 1- xp hvor x 1 og p -1 som gir . Dette gir da en form for vektet glidende gjennomsnitt av skjemaet. Denne summeringen kan skrives som en tilbakevendingsrelasjon som forenkler beregningen sterkt, og unngår problemet at vektningsregimet strengt bør være uendelig for vektene som summen til 1 for små verdier av dette er vanligvis ikke tilfellet Notasjonen som brukes av forskjellige forfattere varierer Noen bruker bokstaven S for å indikere at formelen er i hovedsak en glatt variabel, og skrive. avhengig av hvilken kontrollteori litteratur ofte bruker Z i stedet for S for eksponentielt vektet eller glattet verdier se for eksempel Lucas og Saccucci, 1990, LUC1 og NIST-nettsiden for flere detaljer og bearbeidede eksempler. Formlene som er nevnt ovenfor kommer fra Roberts 1959, ROB1, men Hunter 1986, HUN1 bruker et uttrykk for skjemaet. som kan være mer hensiktsmessig for bruk i enkelte kontrollprosedyrer Med 1 er gjennomsnittlig estimat bare dens målte verdi eller verdien av det forrige dataelementet Med 0 5 er estimatet det enkle m ove gjennomsnitt av nåværende og tidligere målinger I prognosemodellene er verdien S t ofte brukt som estimat eller prognoseverdi for neste tidsperiode, det vil si som estimatet for x på tidspunktet t 1 Vi har således. Dette viser at prognosen verdi på tidspunktet t 1 er en kombinasjon av det forrige eksponentielt vektede glidende gjennomsnittet pluss en komponent som representerer den veide prediksjonsfeilen, på tidspunktet t. Avdeling av en tidsserie er gitt og en prognose er nødvendig, en verdi for er nødvendig. Dette kan estimeres fra eksisterende data ved å evaluere summen av kvadrert prediksjonsfeil oppnås med varierende verdier for hver t 2,3 som angir det første estimat for å være den første observerte dataværdi, x 1 I styringsapplikasjoner er verdien av det viktige som er brukt i bestemmelsen av de øvre og nedre kontrollgrensene, og påvirker den gjennomsnittlige kjølelengde som forventes før disse kontrollgrensene brytes under antagelsen om at tidsseriene representerer et sett av tilfeldige, identiske distribuert uavhengige variabler med felles varians Under disse omstendighetene er variansen av kontrollstatistikken Lucas og Saccucci, 1990. Kontrollgrenser vanligvis sett som faste multipler av denne asymptotiske variansen, f. eks. - 3 ganger standardavviket Hvis f. eks. 0 25, og dataene som overvåkes antas å ha en Normal fordeling, N 0,1, når kontrollen er, vil kontrollgrensene være - 1 134 og prosessen vil nå en eller annen grense i 500 trinn i gjennomsnitt Lucas og Saccucci 1990 LUC1 derivere ARLene for et bredt spekter av verdier og under ulike forutsetninger ved bruk av Markov Chain-prosedyrer De tabulerer resultatene, inkludert å gi ARLer når gjennomsnittet av kontrollprosessen har blitt forskjøvet med noen flere av standardavviket For eksempel med et 0 5 skift med 0 25 ARL er mindre enn 50 timers trinn. Tilnærmingene beskrevet ovenfor er kjent som enkelt eksponensiell utjevning som prosedyrene blir brukt en gang til tidsserien og deretter analyserer eller styrer pr Ocesses utføres på det resulterende glatte datasettet. Hvis datasettet inneholder en trend og eller sesongbestandige komponenter, kan to - eller tre-trinns eksponensiell utjevning brukes som et middel til å fjerne eksplisitt modellering disse effektene se videre, avsnittet om prognose nedenfor og NIST fungerte som eksempel. CHA1 Chatfield C 1975 Analysen av Times Series Theory and Practice Chapman og Hall, London. HUN1 Hunter J S 1986 Det eksponentielt vektede glidende gjennomsnitt J av Quality Technology, 18, 203-210. LUC1 Lucas J M, Saccucci M S 1990 Eksponentielt vektede Flytte gjennomsnittlige kontrollsystemer Egenskaper og forbedringer Technometrics, 32 1, 1-12. ROB1 Roberts SW 1959 Kontrolldiagramtester basert på geometriske bevegelige gjennomsnitt Technometrics, 1, 239-250.What er forskjellen mellom flytte gjennomsnittlig og vektet glidende gjennomsnitt. Et 5-års glidende gjennomsnitt, basert på prisene ovenfor, ville bli beregnet ved hjelp av følgende formel. Basert på ligningen ovenfor var gjennomsnittsprisen over den ovennevnte perioden 90 66 Ved å bruke glidende gjennomsnitt er en effektiv metode for å eliminere sterke prisfluktuasjoner. Nøkkelbegrensningen er at datapunkter fra eldre data ikke veies noe annerledes enn datapunkter nær begynnelsen av datasettet Dette er hvor vektede bevegelige gjennomsnitt kommer til spill. Vektede gjennomsnitt tilordner en tyngre vekting til mer gjeldende datapunkter siden de er mer relevante enn datapunkter i den fjerne fortiden Summen av vektingen skal legge til opptil 1 eller 100 I tilfelle av det enkle glidende gjennomsnittet, er vektene fordelt like mye, og derfor er de ikke vist i tabellen ovenfor. Avsluttende pris på AAPL. Stata Data Analyse og statistisk programvare. Nicholas J Cox, Durham University, Storbritannia Christopher Baum, Boston College. egen, ma og dens begrensninger. Stata s mest åpenbare kommando for å beregne glidende gjennomsnitt er ma-funksjonen av egen. Gitt et uttrykk, skaper det en periode Flyttende gjennomsnitt av det uttrykket Som standard blir det tatt 3 må være merkelig. Men som den manuelle oppføringen indikerer, kan egen ma ikke kombineres med varlist og av den grunn alene er den ikke aktuell for paneldata I noen tilfelle står det utenfor settet av kommandoer som er spesifikt skrevet for tidsserier, se tidsserier for detaljer. Andre forhold. For å beregne bevegelige gjennomsnitt for paneldata, er det minst to valg. Begge avhenger av datasettet som har blitt forhåndssettet. Dette er veldig mye verdt å gjøre ikke bare kan du spare deg selv gjentatte ganger angi panelvariabel og tidsvariabel, men Stata oppfører seg smart gitt eventuelle hull i dataene. 1 Skriv din egen definisjon ved å bruke generere. Bruke tidsserier operatører s uch som L og F gir definisjonen av det bevegelige gjennomsnittet som argumentet til en generasjonserklæring. Hvis du gjør dette, er du selvsagt ikke begrenset til de likeveide, uveide, sentrerte glidende gjennomsnittene beregnet av egen, ma. For eksempel, like - vektede tre-periode glidende gjennomsnitt vil bli gitt by. and noen vekter kan lett spesifiseres. Du kan selvfølgelig spesifisere et uttrykk som logg myvar i stedet for et variabelt navn som myvar. En stor fordel med denne tilnærmingen er at Stata automatisk utføres det rette for paneldata som fører og lagrer verdier i paneler, akkurat som logikken dikterer at de skal være. Den mest bemerkelsesverdige ulempen er at kommandolinjen kan bli ganske lang hvis det bevegelige gjennomsnittet innebærer flere vilkår. Et annet eksempel er en ensidig glidende gjennomsnitt basert bare på tidligere verdier Dette kan være nyttig for å generere en adaptiv forventning om hva en variabel vil være basert på på informasjon til dags dato hva kan noen forutsi for curr En periode på 4-tiden kan være spesielt vanlig i kvartalsvise tidsrom. Bruk egen, filter fra SSC. Bruk det brukerskrevne egenfunksjonsfilteret fra egenmore-pakken på SSC. I Stata 7 oppdatert etter 14. november 2001, kan du installere denne pakken by. after hvilken hjelp egenmore peker på detaljer på filter De to eksemplene ovenfor vil bli gjengitt. I denne sammenligningen er generasjonsmetoden kanskje mer gjennomsiktig, men vi vil se et eksempel på det motsatte i et øyeblikk. Lags er en numlist-fører som negativ lags i dette tilfellet -1 1 utvides til -1 0 1 eller led 1, lag 0 , lag 1 Koblingsficientene, en annen numlist, multipliser de tilsvarende lags eller ledende elementene i dette tilfellet er disse elementene myvar og Effekten av normaliseringsalternativet er å skalere hver koeffisient med summen av koeffisientene slik at koef 1 1 1 normaliserer er som tilsvarer koeffisientene 1 3 1 3 1 3 og coef 1 2 1 normaliserer, er ekvivalent med koeffisientene på 1 4 1 2 1 4.Du må spesifisere ikke bare lagene, men også koeffisientene. Fordi egen, ma gir likevektig sak, hovedgrunnlaget for egen, filteret er å støtte det ulikt vektede tilfellet, som du må spesifisere koeffisienter Det kan også sies at forpliktelse til brukere å spesifisere koeffisienter er et lite ekstra trykk på dem for å tenke på hvilke koeffisienter de vil ha. Hovedgrunnlaget for like vekter er vi gjetning, enkelhet, men likevekt har elendige frekvensdomene egenskaper, for å nevne bare en vurdering. Det tredje eksemplet ovenfor kan være. Hver av disse er omtrent like komplisert som genereringsmetoden. Det er tilfeller der egen , filter gir en enklere formulering enn å generere Hvis du vil ha et ni-termisk binomialfilter, hvilke klimatologer finner nyttige, så er det kanskje mindre fryktelig enn, og lettere å få riktig enn. Bare som med genereringsmetoden, fungerer filteret riktig med paneldata Faktisk, som nevnt ovenfor, er det avhengig av datasettet som har blitt satt på forhånd. En grafisk tips. Etter at du har beregnet dine bevegelige gjennomsnitt, vil du sannsynligvis ønske å se på en graf. Den brukerskrevne kommandoen tsgraph er smart om tsset datasett Installer den i en oppdatert Stata 7 ved hjelp av ssc inst tsgraph. Hva om å subsette med if. None av de ovennevnte eksemplene gjør bruk av hvis begrensninger Faktisk egen, ma vil ikke tillate hvis det skal spesifiseres Noen ganger folk wa nt å bruke hvis når man beregner glidende gjennomsnitt, men bruken er litt mer komplisert enn det vanligvis er. Hva ville du forvente av et glidende gjennomsnitt beregnet med hvis La oss identifisere to muligheter. Vi vil ikke se noen resultater for de utelukket observasjonene. Stort fortolkning Jeg vil ikke engang at du skal bruke verdiene for de ekskluderte observasjonene. Her er et konkret eksempel Anta som en konsekvens av noen om tilstanden er observasjoner 1-42 inkludert, men ikke observasjoner 43 på Men det glidende gjennomsnittet for 42 vil blant annet avhenge av verdien for observasjon 43 dersom gjennomsnittet strekker seg bakover og fremover og er lengde minst 3, og det vil på tilsvarende måte avhenge av noen av observasjonene 44 og videre under noen omstendigheter. Vi antar at de fleste ville gå for den svake tolkningen, men om det er riktig, selv, støtter filteret ikke hvis du enten kan ignorere hva du ikke vil ha eller til og med sette uønskede verdier til å mangle etterpå b y bruker erstatning. En notat om manglende resultater i enden av seriene. Fordi glidende gjennomsnitt er funksjoner av lags og leads, produserer ma mangler hvor lags og ledninger ikke eksisterer, i begynnelsen og slutten av serien. Et alternativ nomiss tvinger beregningen av kortere, uberørte glidende gjennomsnitt for haler. I motsetning, genererer heller ikke egen, filter gjør eller tillater noe spesielt for å unngå å savne resultater. Hvis noen av verdiene som trengs for beregning mangler, mangler det resultatet. Det er opp til brukerne å avgjøre om og hvilken korrigerende kirurgi som kreves for slike observasjoner, antagelig etter at man har sett på datasettet og tatt i betraktning alle underliggende vitenskaper som kan bli båret.

No comments:

Post a Comment