Thursday 12 October 2017

Flytte Gjennomsnittet Vindu Stata


Jeg har en liste over personer, registreringstider og poengsummer I Stata vil jeg beregne et glidende gjennomsnitt av poengsum basert på et tidsvindu rundt hver observasjon, ikke et vindu basert på lagring av ledende antall observasjoner. For eksempel, forutsatt - 2 dager på hver side og ikke med den nåværende observasjonen, prøver jeg å beregne noe som dette. Jeg har forsøkt å definere datasettet med tsset og deretter bruke tssmooth, men kunne ikke få det til å fungere. Siden det kan være flere observasjoner for en gitt tidsperiode, jeg Jeg er ikke sikker på at dette er til og med den riktige tilnærmingen. I virkeligheten er dagvariabelen en tc timestamp. asked 6. desember kl. 16 04.tsset kan ikke hjelpe her selv om du har laget dine tider regelmessig i mellomrom, da du har noen gjentatte verdier for tid, men dine data kvalifiserer ikke som paneldata i Stata s-forstand, men problemet burde gi en sløyfe over muligheter. Først, la oss ta eksemplet ditt bokstavelig talt ved å bruke heltidsdager. Her antar vi ingen manglende verdier. Prinsippet for videreføring er. gjennomsnitt av andre summen av alle - dette verdien antall verdier - 1.I praksis vil du ikke sløyfe over alle mulige datatider i millisekunder. Så prøv en løkke over observasjoner av dette skjemaet. Merk pseudokodeelementer. Dette papiret er også relevant . Hvis mangler er mulige, må en linje være mer komplisert. Det betyr at hvis den nåværende verdien mangler, trekker vi 0 fra summen og 0 fra antall observasjoner. EDIT I ​​2 dager i millisekunder utnytter den innebygde funksjonen og bruker cofd 2.Denne datastrukturen er ganske uegnet til formodning. Hvis du antar et ID-ID, må du omforme e g. Then et glidende gjennomsnitt er enkelt Bruk tssmooth eller bare generer e g. Mer på hvorfor datastrukturen din er ganske uegnet. Ikke bare ville beregning av et glidende gjennomsnitt trenger en sløyfe som ikke nødvendigvis involverer egen, men du vil skape flere nye ekstravariabler. Bruk av de i en hvilken som helst etterfølgende analyse vil være et sted mellom vanskelig og umulig. EDIT Jeg skal gi en prøvesløyfe, mens jeg ikke beveger meg fra min holdning at den Jeg s dårlige teknikk Jeg ser ikke grunnen til navnetkonvensjonen din, hvor P1947 er et middel for 1943-1945. Jeg antar at det bare er en skrivefeil. La oss anta at vi har data for 1913-2012. For 3 år mister vi ett år ved hver ende. Det kan skrives mer kortfattet, på bekostning av makter i makroer i makroer. Bruk av ujevne vekter er enkelt, som ovenfor. Den eneste grunnen til å bruke egen er at den ikke gir opp hvis det er mangler, som ovenfor vil gjøre. Som et spørsmål om fullstendighet, merk at det er enkelt å håndtere feil uten å benytte egen. andnevneren. Hvis alle verdier mangler, reduseres dette til 0 0, eller mangler Ellers, hvis noen verdi mangler, legger vi til 0 til telleren og 0 til nevneren, som er den samme som å ignorere den. Naturligvis er koden tålelig som ovenfor i gjennomsnitt på 3 år, men enten for det tilfellet eller i gjennomsnitt over flere år, ville vi erstatte linjene over med en sløyfe, hvilket er hva som gjør. Når du beregner et løpende bevegelige gjennomsnitt, plasserer du t Gjennomsnittet i mellomtiden er fornuftig. I det forrige eksemplet beregner vi gjennomsnittet av de første 3 tidsperiodene og plasserte det ved siden av periode 3 Vi kunne ha plassert gjennomsnittet midt i tidsintervallet på tre perioder, det vil si , ved siden av periode 2 Dette fungerer bra med ulike tidsperioder, men ikke så bra for jevne tidsperioder Så hvor skulle vi plassere det første glidende gjennomsnittet når M 4. Teknisk sett ville det bevegelige gjennomsnittet falle på t 2 5, 3 5.To unngår dette problemet, slipper vi MAs ved hjelp av M 2. Vi glatter de glatte verdiene. Hvis vi gjennomsnittlig et jevnt antall vilkår, må vi glatte de glatte verdiene. Følgende tabell viser resultatene ved å bruke M 4.

No comments:

Post a Comment