Wednesday 1 November 2017

Liukuva Keskiarvo On Aika Sarjat


Keskimääräiset liikkeet Siirtyvät keskiarvot Tavallisten datasetien keskimääräinen arvo on usein ensimmäinen ja yksi hyödyllisimmistä yhteenvetotietojen laskemisesta. Kun tieto on aikasarjan muodossa, sarjaväylä on hyödyllinen toimenpide, mutta se ei heijasta tietojen dynaamista luonnetta. Keskimääräiset arvot, jotka lasketaan oikaistuneiden jaksojen aikana, joko ennen nykyistä ajanjaksoa tai keskittyneet nykyiseen kauteen, ovat usein hyödyllisimpiä. Koska tällaiset keskiarvot vaihtelevat tai liikkuvat, koska nykyinen kausi siirtyy ajasta t2, t3 jne., Ne tunnetaan liikkuvina keskiarvona (Mas). Yksinkertainen liikkuva keskiarvo on (tyypillisesti) k ennalta annettujen arvojen painottamaton keskiarvo. Eksponentiaalisesti painotettu liikkuva keskiarvo on oleellisesti sama kuin yksinkertainen liukuva keskiarvo, mutta keskimääräinen painotus niiden läheisyydessä nykyiseen aikaan. Koska ei ole yhtä, vaan koko joukko liikkuvia keskiarvoja millekään tietylle sarjalle, Mas-sarjaa voidaan itse piirtää graafeilla, analysoida sarjana ja käyttää mallinnuksessa ja ennusteessa. Malleja voidaan rakentaa käyttämällä liikkuvia keskiarvoja, ja niitä kutsutaan MA-malleiksi. Jos tällaisia ​​malleja yhdistetään autoregressiivisiin (AR) malleihin, syntyvät komposiittimallit tunnetaan ARMA - tai ARIMA-malleiksi (I on integroitu). Yksinkertaiset liikkuvat keskiarvot Koska aikasarjaa voidaan pitää arvojen joukona, t 1,2,3,4, n näiden arvojen keskiarvo voidaan laskea. Jos oletamme, että n on melko suuri, ja valitaan kokonaisluku k, joka on paljon pienempi kuin n. voimme laskea joukon lohkojen keskiarvoja tai yksinkertaisia ​​liikkuvia keskiarvoja (tilauksesta k): Jokainen mitta edustaa datajoukon keskiarvoa k-havaintojen väliin. Huomaa, että ensimmäinen mahdollinen järjestyskäsky k gt0 on tk: lle. Yleisemmin voimme pudottaa ylimääräisen indeksin yllä oleviin ilmentymiin ja kirjoittaa: Tämä kertoo, että arvioitu keskiarvo ajankohtana t on havaitun arvon yksinkertainen keskiarvo ajankohtana t ja edeltävät k-1-vaiheet. Jos käytetään painoja, jotka vähentävät havaintomäärän kauempana olevia osuuksia, liikkuvan keskiarvon sanotaan olevan eksponentiaalisesti tasoitettu. Keskimääriä siirretään usein ennusteiden muodossa, jolloin sarjan arvioitu arvo hetkellä t 1, S t1. pidetään MA: ksi ajanjaksoon t ja siihen asti. esim. nykypäivän arvion mukaan keskiarvo ennalta kirjattujen arvojen päivämääristä (päivittäisiin tietoihin asti) mukaan lukien. Yksinkertaisia ​​liukuvia keskiarvoja voidaan nähdä tasoitusmuodoksi. Seuraavassa esimerkissä ilmaa aiheuttavan ilman pilaantumatietokantaan on lisätty 7-päiväinen liikkuvan keskiarvon (MA) linja, joka on esitetty tässä punaisella. Kuten voidaan nähdä, MA-linja tasoittaa datan huiput ja kourut ja voi olla erittäin hyödyllistä tunnistaa suuntaukset. Tavallinen laskentataulukko tarkoittaa, että ensimmäisillä k-1-pisteillä ei ole MA-arvoa, mutta tämän jälkeen laskelmat ulottuvat sarjan lopulliseen datapisteeseen. PM10 päivittäiset keskiarvot, Greenwichin lähde: London Air Quality Network, londonair. org. uk Yksi syy yksinkertaisten liikkuvien keskiarvojen laskemiseen kuvatulla tavalla on se, että se mahdollistaa arvojen laskemisen kaikkien aikavälien osalta ajasta tk aina tähän asti. kun uutta mittausta saadaan ajasta t 1, ajastimelle MA voidaan lisätä jo laskettu joukko. Tämä tarjoaa yksinkertaisen menettelyn dynaamisille datasetsille. Tällä lähestymistavalla on kuitenkin joitakin ongelmia. On järkevää väittää, että keskimääräinen arvo viimeisten kolmen jakson aikana pitäisi olla ajan hetkellä t -1 eikä aika t. ja MA: lle parillisen määräjaksojen aikana, ehkä se olisi sijoitettava keskipisteen väliin kahden aikajakson välillä. Ratkaisu tähän kysymykseen on käyttää keskitettyjä MA-laskelmia, joissa MA on ajankohtana t symmetrisen arvoryhmän keskiarvoa ympärillä t. Huolimatta sen ilmeisistä ansioista, tätä lähestymistapaa ei yleensä käytetä, koska se vaatii tietojen saatavuutta tuleville tapahtumille, mikä ei välttämättä ole asianlaita. Jos analyysi on kokonaan olemassa olevasta sarjasta, keskitetyn Mas-mallin käyttö voi olla edullista. Yksinkertaisia ​​liikkuvia keskiarvoja voidaan pitää tasoitusmuodona, poistaa joitain aikasarjojen korkeataajuisia komponentteja ja korostaa (mutta ei poistaa) trendejä samalla tavoin kuin digitaalisen suodatuksen yleinen käsitys. Itse asiassa liukuvat keskiarvot ovat lineaarisen suodattimen muoto. On mahdollista soveltaa liikkuvan keskimääräisen laskennan jo tasoitettuun sarjaan, ts. Tasoittamalla tai suodattamalla jo tasoitettua sarjaa. Esimerkiksi järjestyksessä 2 liikkuvan keskiarvon perusteella voimme pitää sitä laskettaessa painojen mukaan, joten MA: ssa x 2: ssa 0,5 x 1 0,5 x 2. Samalla MA: lla x 3: lla 0,5 x 2 x 0,5 x 3. Jos me (0,5 x 2 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 eli 2-vaiheinen suodatus prosessi (tai konvoluutio) on tuottanut vaihtelevan painotetun symmetrisen liukuvan keskiarvon painoilla. Useat konvoluutiot voivat tuottaa varsin monimutkaisia ​​painotettuja liikkuvia keskiarvoja, joista osa on todettu erityisen käyttökelpoisiksi erikoistuneilla aloilla, kuten henkivakuutuslaskelmissa. Siirrettäviä keskiarvoja voidaan käyttää jaksoittaisten vaikutusten poistamiseen, jos lasketaan jaksollisuuden pituudella tunnetuksi. Esimerkiksi kuukausittaiset tiedot kausivaihteluista voidaan usein poistaa (jos tämä on tavoite) soveltamalla symmetristä 12 kuukauden liukuvaa keskiarvoa kaikkien kuukausien painotettuna yhtä suureksi, paitsi ensimmäiset ja viimeiset, jotka painotetaan 12: lla. Tämä johtuu siitä, että olla 13 kuukautta symmetrisessä mallissa (nykyinen aika, t. - 6 kuukautta). Kokonaismäärä jaetaan 12: llä. Samanlaiset menettelyt voidaan toteuttaa mille tahansa hyvin määritellylle jaksolle. Eksponentiaalisesti painotetut liikkuvat keskiarvot (EWMA) Yksinkertaisella liikkuva keskiarvolla: kaikki havainnot ovat yhtä painotettuja. Jos kutsuttiin nämä yhtä suuret painot, alpha t. kukin k-paino olisi 1 k. joten painojen summa olisi 1 ja kaava olisi: Olemme jo nähneet, että tämän prosessin useat sovellukset johtavat painoihin vaihtelevasti. Eksponentiaalisesti painotetuilla liikkuvilla keskiarvoilla harkitaan vähentyneiden havaintojen keskimääräistä vaikutusta, mikä korostaa viimeaikaisia ​​(paikallisia) tapahtumia. Pohjimmiltaan tasoitusparametri, 0lt alpha lt1, otetaan käyttöön ja kaava tarkistetaan: Tämän kaavan symmetrinen versio olisi muotoa: Jos symmetrisessä mallissa olevat painot valitaan binomialgian ehtojen termeiksi, (1212) 2q. ne summaavat 1: een, ja kun q tulee suureksi, se vastaa likimääräistä jakautumista. Tämä on ytimen painotuksen muoto, jossa binomiomi toimii ydinfunktiossa. Edellisessä kappaleessa kuvattu kaksiportainen konvoluutio on juuri tämä järjestely, jossa q 1, jolloin painot saadaan. Eksponentiaalisessa tasoituksessa on käytettävä joukko painoja, jotka summaavat 1 ja jotka pienentävät kokoa geometrisesti. Käytetyt painot ovat tyypillisesti muotoa: Näiden painojen summana 1: ksi katsotaan 1: n laajeneminen sarjaksi. Voimme kirjoittaa ja laajentaa ilmaisua suluissa binomi-kaavalla (1- x) p. jossa x (1-) ja p-1, joka antaa: Tämä muodostaa muodon painotetun liukuvan keskiarvon: Tämä summaus voidaan kirjoittaa uudelleenkorjaussuhteeksi, joka yksinkertaistaa laskennan suuresti ja välttää ongelman, tulisi olla ehdottomasti ääretön painojen summana 1: een (alfa-arvojen pienet arvot, tämä ei yleensä ole tapaus). Eri kirjoittajien käyttämä notaatio vaihtelee. Jotkut käyttävät kirjainta S osoittaen, että kaava on olennaisesti tasoitettu muuttuja ja kirjoittaa: kun taas ohjausteoria kirjallisuus käyttää usein Z: tä pikemmin kuin S: n eksponentiaalisesti painotettuja tai tasoitettuja arvoja (katso esimerkiksi Lucas ja Saccucci, 1990, LUC1 , ja NIST verkkosivuilla lisätietoja ja toiminut esimerkit). Edellä mainitut kaavat johtuvat Robertsin työstä (1959, ROB1), mutta Hunter (1986, HUN1) käyttää muotoilua, joka voi olla sopivampi käytettäväksi joissakin valvontatoimenpiteissä. Alfa 1: n keskiarvo on yksinkertaisesti sen mitattu arvo (tai edellisen tietoerän arvo). 0,5: llä arvio on nykyisen ja edellisen mittauksen yksinkertainen liukuva keskiarvo. Ennustemalleissa arvo S t. käytetään usein ennustearvona tai ennustearvona seuraavalle ajanjaksolle, eli x: n arvoksi t hetkellä t 1. Näin ollen: Tämä osoittaa, että ennustearvo ajankohtana t 1 on edellisen eksponentiaalisesti painotetun liukuvan keskiarvon sekä komponentti, joka edustaa painotettua ennustevirhettä, epsilon. ajankohtana t. Olettaen, että aikasarja on annettu ja tarvitaan ennuste, tarvitaan alfa-arvo. Tämä voidaan arvioida olemassa olevista tiedoista arvioimalla neliön ennustevirheiden summa saadaan vaihtelevilla alfa-arvoilla kullekin t 2,3: lle. ensimmäisen arvion asettaminen ensimmäiseksi havainnoiduksi datan arvoksi x 1. Ohjaussovelluksissa alfa-arvo on tärkeä, sillä sitä käytetään ylemmän ja alemman kontrollin rajojen määrittämisessä ja vaikuttaa odotettuun keskimääräiseen ajon pituuteen (ARL) ennen kuin nämä valvontarajat rikkoutuvat (olettaen, että aikasarja edustaa joukkoa satunnaisia, identtisesti jakamia riippumattomia muuttujia, joilla on yhteinen varianssi). Näissä olosuhteissa kontrollitilaston varianssi on: (Lucas ja Saccucci, 1990): Ohjausrajat asetetaan tavallisesti tällaisen asymptoottisen varianssien kiinteiksi kerrannaisiksi, esim. - 3-kertainen keskihajonta. Jos esim. Alfa-arvoa 0,25 ja valvottavaa dataa oletetaan olevan normaali jakautuma, N (0,1), kun kontrollissa ohjausrajat ovat - 1,134 ja prosessi saavuttaa yhden tai useamman rajan 500 vaiheessa keskimäärin. Lucas ja Saccucci (1990 LUC1) tuottavat ARL-arvot monille alfa-arvoille ja erilaisissa olettamuksissa käyttäen Markovin ketjumenetelmiä. Ne tulostavat taulukot, mukaan lukien ARL: ien tarjoaminen, kun kontrolliprosessin keskiarvo on siirretty keskiarvon muutaman kerran. Esimerkiksi 0,5-siirtymällä alfa 0,25: lla ARL on alle 50 aikaportaat. Yllä kuvatut lähestymistavat tunnetaan yhtenä eksponentiaalisena tasoituksena. koska menetelmiä sovelletaan kerran aikasarjaan ja sitten analysoidaan tai ohjataan prosessit tuloksena olevan tasoitetun datasarjan avulla. Jos datasarja sisältää trendin ja tai kausittaiset komponentit, voidaan käyttää kahden tai kolmen vaiheen eksponentiaalisia tasoituksia näiden vaikutusten poistamista (eksplisiittisesti mallinnusta varten) (katso tarkemmin alla oleva ennakointi ja esimerkki NIST: stä). CHA1 Chatfield C (1975) Times-sarjan analyysi: teoria ja käytäntö. Chapman ja Hall, London HUN1 Hunter J S (1986) Eksponentiaalisesti painotettu liukuva keskiarvo. J, Quality Technology, 18, 203 - 210 LUC1 Lucas J M, Saccucci M S (1990) Eksponentiaalisesti painotetut liikkuvat keskiarvojärjestelmät: ominaisuudet ja parannukset. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrollikartatutkimukset Geometristen liikuttavien keskiarvojen perusteella. Technometrics, 1, 239-2502.1 Siirrettävät keskimääräiset mallit (MA-mallit) ARIMA-malleihin kutsutuilla aikasarjamalleilla voi olla autoregressiivisiä termejä tai liikkuvia keskimääräisiä termejä. Viikolla 1 opimme autoregressiivisen termin aikasarjamallissa muuttujalle x t, joka on x t: n viivästynyt arvo. Esimerkiksi viive 1 autoregressiivinen termi on x t-1 (kerrottuna kertoimella). Tässä oppitunnissa määritellään liikkuvat keskimääräiset ehdot. Ajallisen sarjamallin liukuva keskimääräinen termi on aiempi virhe (kerrottuna kertoimella). Olkoon (wt overset N (0, sigma2w)), mikä tarkoittaa, että w t ovat identtisesti ja toisistaan ​​riippumattomasti jakautuneita, joista kullakin on normaali jakauma, jolla on keskiarvo 0 ja sama varianssi. Ensimmäisen kertaluvun keskimääräinen malli, jota merkitään MA (1) on (xt mu wt theta1w) 2. järjestysliike keskimääräinen malli, jota merkitään MA (2) on (xt mu wt theta1w theta2w) , merkitty MA (q) on (xt mu wt theta1w theta2w pistettä thetaqw) Huom. Monet oppikirjat ja ohjelmistot määrittelevät mallin negatiivisilla merkillä ennen termejä. Tämä ei muuta mallin yleisiä teoreettisia ominaisuuksia, vaikka se kääntyy arvioidun kerroinarvon algebrallisten merkkien ja (epäsuosittujen) termien kanssa kaavojen ACF ja varianssit. Sinun on tarkistettava ohjelmistosi tarkistaaksesi, onko negatiivisia tai positiivisia merkkejä käytetty arvioidun mallin kirjoittamiseen oikein. R käyttää positiivisia merkkejä sen perustana olevassa mallissa, kuten täälläkin. Ajoitussarjan teoreettiset ominaisuudet MA (1) - mallilla Huomaa, että teoreettisen ACF: n ainoa ei-arvo on viiveellä 1. Kaikki muut autokorrelaatiot ovat 0. Näin ollen näytteen ACF, jolla on merkittävä autokorrelaatio vain viiveellä 1, on mahdollisen MA (1) - mallin indikaattori. Kiinnostuneille opiskelijoille todisteet näistä ominaisuuksista ovat liitteenä tämän esitteen. Esimerkki 1 Oletetaan, että MA (1) - malli on x t 10 w t .7 w t-1. jossa (ylimitoitettu N (0,1)). Siten kerroin 1 0,7. Teoreettinen ACF annetaan tämän ACF: n piirroksella. Juuri näytetty tontti on teoreettinen ACF MA (1): lle, jossa on 1 0,7. Käytännössä näyte tavallisesti tarjoaa tällaisen selkeän kuvion. Käyttämällä R simuloitimme n 100 näytearvoja käyttäen mallia x t 10 w t .7 w t-1 missä w t iid N (0,1). Tätä simulaatiota varten noudatetaan näyteaineiston aikasarjaa. Emme voi kertoa paljon tästä tontista. Seuraavaksi seuraa simuloitujen tietojen näyte ACF. Nähdään piikki viiveellä 1, mitä seuraa yleisesti ei-merkittäviä arvoja viivästyneelle ohi 1: lle. Huomaa, että näyte ACF ei vastaa taustalla olevan MA: n teoreettista mallia (1), eli että kaikki autokorrelaatiot myöhästyneille 1 ovat 0 . Erilaisella näytteellä olisi hieman erilainen näyte ACF alla, mutta sillä olisi todennäköisesti samat laaja piirteet. MA (2) - mallin teoreettiset ominaisuudet Teoreettiset ominaisuudet ovat seuraavat: Huomaa, että teoreettisessa ACF: ssä vain ei-nolla-arvot ovat viiveille 1 ja 2. Autokorrelaatioita suuremmille viiveille ovat 0 , Joten näyte ACF, jolla on merkittäviä autokorrelaatioita viiveissä 1 ja 2, mutta ei-merkittävät autokorrelaatiot suuremmille viiveille osoittavat mahdollisen MA (2) - mallin. iid N (0,1). Kertoimet ovat 1 0,5 ja 2 0,3. Koska tämä on MA (2), teoreettisella ACF: llä on ei-arvoja vain viiveillä 1 ja 2. Näiden kahden nonzero-autokorrelaation arvot ovat teoreettisen ACF: n piirre. Kuten lähes aina on, näyte-tiedot käyttäytyvät aivan yhtä hyvin kuin teorian. Simuloimme n 150 mallinäytettä mallille x t 10 wt .5 w t-1 .3 w t-2. missä w t iid N (0,1). Aikasarjan tietue seuraa. Kuten MA: n (1) näytetietojen aikasarjoissa, et voi kertoa paljon siitä. Seuraavaksi seuraa simuloitujen tietojen näyte ACF. Kuvio on tyypillinen tilanteissa, joissa MA (2) malli voi olla hyödyllinen. Kaksi tilastollisesti merkitsevää piikkiä on viiveissä 1 ja 2, mitä seuraa ei-merkittäviä arvoja muille viiveille. Huomaa, että näytteenottovirheen vuoksi näyte ACF ei täsmälleen vastaa teoreettista mallia. ACF yleisille MA (q) - malleille MA (q) - mallien ominaisuus on yleensä se, että ensimmäisten q-viiveiden ja autokorrelaatioiden 0 osalta on kaikkiin viiveisiin gt q. Ei-ainutlaatuisuus yhteyden arvojen 1 ja (rho1) välillä MA (1) Malli. MA (1) - mallissa, mikä tahansa arvo on 1. vastavuoroinen 1 1 antaa saman arvon Esimerkille, käytä 0,5 1: lle. ja käytä sitten 1 (0,5) 2 1: lle. Youll saada (rho1) 0.4 molemmissa tapauksissa. Teoreettisen rajoituksen tyydyttämiseksi kutsutaan invertibility. rajoitamme MA (1) - malleja arvoihin, joiden absoluuttinen arvo on pienempi kuin 1. Jo annetussa esimerkissä 1 0,5 on sallittu parametriarvo, kun taas 1 10,5 2 ei. MA-malleiden invertibility MA-mallin sanotaan olevan käännettävissä, jos se on algebrallisesti samanlainen kuin yhdensuuntainen ääretön AR-malli. Lähentymällä tarkoitamme, että AR-kertoimet pienenevät arvoon 0 kun siirrymme ajassa taaksepäin. Invertibility on rajoitus, joka on ohjelmoitu aikasarjaohjelmistoihin, joita käytetään estimoimaan MA-termejä käyttävien mallien kertoimet. Se ei ole jotain, jota tarkistamme tietojen analysoinnissa. Lisätiedot MA (1) - malleista, jotka koskevat invertibility-rajoitusta, annetaan lisäyksessä. Advanced Theory Note. MA (q) - mallilla, jolla on määritetty ACF, on vain yksi muutettavissa oleva malli. Tarvittava edellytys vaihtovirtaukselle on, että kertoimilla on sellaiset arvot, että yhtälö 1- 1 y-. - q y q 0 on ratkaisuja y, jotka kuuluvat yksikön ympyrän ulkopuolelle. Esimerkkien R-koodi Esimerkissä 1 piirrettiin mallin x t 10 w t teoreettinen ACF. 7w t-1. ja simuloi sitten n 150 arvot tästä mallista ja piirrettiin näyteajasarjat ja näyte ACF simuloituun dataan. Teoreettisen ACF: n piirtämiseen käytetyt R-komennot olivat: acfma1ARMAacf (mac (0.7), lag. max10) 10: n ACF: n viiveet MA: lla (1) ja theta1 0.7 lags0: 10 luo muuttujan nimellisviiveet välillä 0-10. (h0) lisää horisontaalisen akselin juonteeseen Ensimmäinen komento määrittää ACF: n ja tallentaa sen objektille (viiveet, acfma1, xlimc (1,10), ylabr, tiph, pää ACF MA: lle (1) nimeltään acfma1 (nimemme valinta). Piirtokomento (kolmas komento) on viivästynyt vastaaviin arvoihin 1 - 10 verrattuna. Ylab-parametri merkitsee y-akselia ja pääparametri asettaa otsikon tontille. Nähdäksesi ACF: n numeeriset arvot käytä yksinkertaisesti komentoa acfma1. Simulaatio ja tontit tehtiin seuraavilla komennoilla. x (x1), list (mac (0.7))) Simuloi n 150 arvot MA: sta (1) xxc10 lisää 10 keskiarvon 10. Simulaatio oletusarvoilla tarkoittaa 0. tonttia (x, typeb, mainSimulated MA (1) acf (x, xlimc (1,10), mainACF simuloitua näytetietoa varten) Esimerkissä 2 piirrettiin mallin teoreettinen ACF 10 wt .5 w t-1 .3 w t-2. ja simuloi sitten n 150 arvot tästä mallista ja piirrettiin näyteajasarjat ja näyte ACF simuloituun dataan. Käytetyt R-komennot olivat: acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 tontti (viiveet, acfma2, xlimc (1,10), ylabr, tiph, pää ACF MA: lle (2) (x, typeb, main simuloitu MA (2) sarja) acf (x, xlimc (1,10), xxc10 mainACF simuloituun MA (2) - tietoon) Liite: MA: n ominaisuuksien todistus (1) Kiinnostuneille opiskelijoille on esitetty todisteet MA (1) - mallin teoreettisista ominaisuuksista. Varianssi: (text (xt) text (mu wt theta1 w) 0 teksti (wt) teksti (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Kun h 1, edellinen lauseke 1 w 2. Missä tahansa h 2, edellinen lauseke 0 . Syy on se, että määritelmästä riippumattomuus wt. E (w k w j) 0 mille tahansa kj. Lisäksi koska w: n keskiarvo on 0, E (w j w j) E (wj 2) w 2. Käytä tätä aikasarjaa varten Käytä tätä tulosta saadaksesi edellä esitetyn ACF: n. Muunneltavissa oleva MA-malli on sellainen, että se voidaan kirjoittaa äärettömän AR-malliksi, joka konvergoituu siten, että AR-kertoimet konvergoituvat 0: een, kun siirrymme äärettömän ajassa taaksepäin. Hyvin osoittavat invertibility MA (1) - mallille. Sitten korvataan yhtälössä (1) (3) oleva wt-1-suhde (2) (zt wt theta1 (z-theta1w) wt theta1z-theta2w) Aikana t-2. yhtälö (2) tulee sitten korvaamaan suhde (4) w t-2: lle yhtälössä (3) (zt wt theta1 z-theta21w wt theta1z-theta21 (z-theta1w) wt theta1z-theta12z theta31w) Jos jatkamme ( äärettömän), saisimme ääretön AR-mallin (zt wt theta1 z-theta21z theta31z-theta41z-pisteet) Huomaa kuitenkin, että jos 1 1 kertoimet kerrottu z: n viiveille kasvaa (äärettömän) kooltaan kun siirrymme takaisin aika. Tämän estämiseksi tarvitsemme 1 lt1. Tämä on ehto invertible MA (1) - mallille. Infinite Order MA - malli Viikolla 3 nähdään, että AR (1) - malli voidaan muuntaa ääretöniseksi MA-malliksi: (xt - mu wt phi1w phi21w pistettä phik1 w dots sum phij1w) Tämä summaus aikaisemmista valkoisista meluista on tiedossa kuten AR: n (1) kausaalinen esitys. Toisin sanoen x t on erityinen MA, jolla on ääretön määrä termejä, jotka menevät ajassa taaksepäin. Tätä kutsutaan ääretöntä järjestystä MA tai MA (). Äärillinen tilaus MA on ääretön tilaus AR ja mikä tahansa äärellinen järjestys AR on ääretön tilaus MA. Muistutettaisiin viikolla 1, huomasimme, että kiinteän AR: n (1) vaatimus on, että 1 lt1. Lasketaan Var (x t) kausaalisen esityksen avulla. Tämä viimeinen vaihe käyttää perustietoa geometrisista sarjoista, jotka edellyttävät (phi1lt1) muuten sarja poikkeaa. Navigation5.2 Smoothing Time Series Smoothing on yleensä tehty auttamaan meitä paremmin nähdä kuvioita, suuntauksia esimerkiksi aikasarjassa. Yleisesti sileä epäsäännöllinen karheus nähdäksesi selkeämmän signaalin. Kausittaisia ​​tietoja voisimme sopeuttaa kausivaihtelun, jotta voimme tunnistaa trendin. Tasoitus ei tarjoa meille mallia, mutta se voi olla hyvä ensimmäinen askel sarjan eri osien kuvaamisessa. Termi suodatinta käytetään joskus kuvaamaan tasoitustoimenpidettä. Jos esimerkiksi tietyn ajan tasoitettu arvo lasketaan lineaarisena yhdistelmänä ympäröivien aikojen havainnoista, voidaan sanoa, että weve käytti lineaarista suodatinta dataan (ei sama kuin sanomalla, että tulos on suora, tapa). Käänteessä liikkuvan keskiarvon perinteinen käyttö on se, että jokaisella ajanhetkellä määritämme tietyn ajan ympäröivien havaittujen arvojen (mahdollisesti painotetut) keskiarvot. Esimerkiksi hetkellä t. keskimääräinen pituus 3 keskimääräinen keskimääräinen keskimääräinen painoarvo olisi arvojen keskiarvo ajankohtana t -1. t. ja t1. Jos haluat poistaa kausiluonteisuuden sarjasta, niin voimme nähdä paremmin trendin, käytämme liikkuvaa keskiarvoa pitkien kausivaihteluiden kanssa. Siksi tasoitetussa sarjassa jokainen tasoitettu arvo on laskettu keskiarvon ympäri kaikkina vuodenaikoina. Tämä voidaan tehdä tarkastelemalla yksipuolista liikkuvaa keskimäärää, jossa keskität kaikki arvot edellisvuosien arvosta tai keskitetty liikkuva keskiarvo, jossa käytät arvoja sekä ennen että sen jälkeen. Esimerkiksi neljännesvuositietoihin voitiin määritellä tasoitettu arvo ajaksi t (x t x t-1 x t-2 x t-3) 4, tämän ajan keskiarvo ja edelliset kolme neljäsosaa. R-koodissa tämä on yksipuolinen suodatin. Keskitetty liukuva keskiarvo luo hieman vaikeuksia, kun meillä on parillinen määrä kausia (kuten tavallisesti). Kausittaisuuden lieventäminen neljännesvuosittain. trendin tunnistamiseksi tavanomainen käytäntö on liikuttaa liukuva keskiarvo tasoitettuna ajankohtana t on Kuukausitietoisuuden tasaus kausivaihteluista. Jotta tavoite tunnistettaisiin, tavanomainen käytäntö on liikuttaa liukuva keskiarvo tasoitettuna ajanhetkellä t. Käytämme painoa 124 arvoihin ajankohtana t6 ja t6 ja painon 112 kaikkien arvojen kanssa aina t5: n ja t5: n välillä. R-suodattimessa määritä hyvin kaksipuolinen suodatin, kun haluamme käyttää arvoja, jotka tulevat sekä ennen että jälkeen, jolloin ne olivat tasoituksia. Huomaa, että kirjan sivulla 71 kirjoittajat käyttävät samaa painoa keskitetyn kausiluonteisen liukuvan keskiarvon kesken. Se onkin kunnossa. Esimerkiksi neljännesvuorisen pehmeämpi voi olla tasoitettu aikaan t on frac x frac x frac xt frac x frac x Kuukausittain pehmeä voi käyttää painoa 113 kaikkiin arvoihin kertaa t-6 t6. Tekijän käyttämä koodi sivulla 72 hyödyntää rep-komentoa, joka toistaa arvon tietyn määrän kertoja. He eivät käytä suodatusparametria suodatinkomennossa. Esimerkki 1 Australiassa neljännesvuoden oluen tuotanto Tarkastelimme sekä oppituntien 1 että 4 oppitunteja neljännesvuosittaisen oluen tuotantoa Australiassa. Seuraava R-koodi luo tasoitetun sarjan, jonka avulla voimme nähdä trendikuviot ja piirtää tämän trendikuvan samaan kaavioon kuin aikasarja. Toinen komento luo ja tallentaa tasoitetun sarjan objektiin, jota kutsutaan trendipohjaksi. Huomaa, että suodatinkomennolla parametri nimeltä suodatin antaa kertoimet tasoitukselle ja sivut 2 aiheuttaa keskitetyn tasaisen laskemisen. (beerprod. dat) trendivälin suodatin (beerprod, suodatin c (18, 14, 14, 14, 18), sivut2) juoni (beerprod, tyyppi b, voi vähentää trenditiedon datan arvoista saadakseen paremman kausiluonteisuuden. Ehdottomasti tämä tapahtuisi: kausityöt beerprod - suuntausmalli (kausiluonteisuus, tyyppi b, tärkein kausittainen kaavoitus oluen tuotantoa varten) Tulos seuraa: Toinen mahdollisuus tasoitussarjan näkemiseen on yksipuolinen suodattimen trendivaihtelu2 suodatin (beerprod, suodatin c (14, 14, 14, 14), sivut1) Tämän avulla tasoitettu arvo on viimeisen vuoden keskiarvo. Esimerkki 2. Yhdysvaltain kuukausittainen työttömyys Viikon 4 kotitehtävissä tarkastit kuukausittaista Yhdysvaltain työttömyyden sarjaa 1948-1978. Tässä on tasoitus, joka on tehty trendin tarkastelemiseksi. trendunemployfilter (työttömät, filterc (124,112,112,112,112,112,112,112,112,112,112,112,124), sivut2) suuntausnäytöt (trendunemploy, alku c (1948,1), frekv 12) juoni (trendunemploy, mainTrend Yhdysvalloissa työttömyydestä, 1948-1978, xlabvuosi) Toinen komento yksilöi sarjan kalenterin aikaominaisuudet. Tällöin tontilla on mielekkäämpi akseli. Tontti seuraa. Muun kuin kausittaisen sarjan osalta et voi sopeutua mihinkään tiettyyn span. Tasoituksen suhteen sinun tulisi kokeilla eri liukuluvuilla liikkuvia keskiarvoja. Nämä ajanjaksot voivat olla suhteellisen lyhyitä. Tavoitteena on irrottaa karkeat reunat nähdäksesi mikä suuntaus tai kuvio voi olla siellä. Muut tasoitusmenetelmät (2.4 jakso) Kappaleessa 2.4 kuvataan useita kehittyneitä ja hyödyllisiä vaihtoehtoja liukuvan keskiarvon tasoittamiseen. Yksityiskohtia voi tuntua houkuttelevalta, mutta se on okei, koska emme halua heikentää paljon yksityiskohtia näistä menetelmistä. Vaiheessa 2.4 kuvatuista vaihtoehtoisista menetelmistä voi olla yleisimmin käytetty alentuma (paikallisesti painotettu regressio). Esimerkki 2 Jatkuu Seuraavassa kuvassa on tasoitettu trendilinja Yhdysvaltain työttömyyssarjasta, joka löytyy alentuneisuuden tasoituksesta, jossa huomattava määrä (23) vaikutti jokaiseen tasoitettuun arvioon. Huomaa, että tämä tasoitti sarjan aggressiivisemmin kuin liikkuva keskiarvo. Käytetyt komennot olivat työttömät (työttömät, alku c (1948,1), freq12) tontti (alentunut työttömyys, f 23), Yhdysvaltain työttömyystrendin päävähennys) Yksittäisen eksponentiaalisen tasoituksen taso Yksittäisen eksponenttien tasoituksen perusennusteen yhtälö on usein annetaan hattuna alfa xt (1-alfa) hattu t teksti Ennusteessa x: n arvon ajanhetkellä t1 on painotettu yhdistelmä havaitusta arvosta hetkellä t ja ennustettu arvo ajankohtana t. Vaikka menetelmää kutsutaan tasoitusmenetelmäksi, sitä käytetään lähinnä lyhytaikaiseen ennusteeseen. Arvoa kutsutaan tasoitusvakiona. Mistä tahansa syystä, 0.2 on suosittu ohjelmien valinta. Tämä asettaa viimeisimmän havainnon perusteella paino 0,2. Ja viimeisimmän ennusteen paino 1,2 .8. Suhteellisen pienellä arvolla tasoitus on suhteellisen laajempi. Suhteellisen suurella arvolla tasoitus on suhteellisen vähäistä, kun havaitulle arvolle asetetaan enemmän painoa. Tämä on yksinkertainen yksiportainen ennakointimenetelmä, joka ensi silmäyksellä ei näytä edellyttävän datan mallia. Itse asiassa tämä menetelmä vastaa ARIMA (0,1,1) - mallin käyttämistä ilman vakiota. Optimaalinen menettely on ARIMA (0,1,1) mallin sovittaminen havaittuun datasarjaan ja tulosten käyttäminen määritettäessä arvoa. Tämä on optimaalinen siinä mielessä, että parhaana voidaan luoda jo havaitut tiedot. Vaikka tavoitteena on tasoittaminen ja ennustaminen eteenpäin, ARIMA (0,1,1) - mallin vastaavuus tuo mukanaan hyvän pisteen. Emme saisi sokeasti soveltaa eksponentiaalisia tasoituksia, koska ARIMA (0,1,1) ei ehkä mallinnut taustalla olevaa prosessia. ARIMA (0,1,1) ja eksponentiaalisen tasoituksen ekvivalenssi Harkitse ARIMA (0,1,1) keskiarvoilla 0 ensimmäisille eroille, xt - x t-1: aloittaa hampun vahvistimen xt theta1 wt amp ampxtxt (xt - niin t) amp amp (1 theta1) xt - theta1hat yleensä. Jos annamme (1 1) ja siten - (1) 1, näemme vastaavuuden edellä olevaan yhtälöön (1). Miksi menetelmää kutsutaan eksponentiaaliseksi tasoitukseksi Tämä tuottaa seuraavaa: Aloita hat amp amp alfa xt (1-alfa) alfa x (1-alfa) hattu amp amp alfa xt alfa (1-alfa) x (1-alfa) tällä tavoin korvaamalla ennustettu arvo yhtälön oikealla puolella. Tämä johtaa seuraaviin: hattu alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x pisteet alfa (1-alfa) jx pisteet alfa (1-alfa) x1 teksti Kaava 2 osoittaa, että ennustettu arvo on painotettu keskiarvo kaikista sarjan aikaisemmista arvoista ja eksponentiaalisesti muuttuvilla painoilla, kun siirrymme sarjaan. Optimaalinen eksponentiaalinen tasoittaminen R: ssä Perustietoa ARIMA: sta (0,1,1) sovitetaan yhteen ja määritetään kerroin. Voimme tutkia sileän sävyn vertaamalla ennustettuja arvoja todelliseen sarjaan. Eksponentiaalinen tasoitus pyrkii käyttämään enemmän ennustustyökaluna kuin todellinen sileämpi, joten he etsivät nähdä, onko meillä hyvä sovitus. Esimerkki 3. n 100 kuukausittaista havaintoa öljyn hintaindeksin logaritmista Yhdysvalloissa. Tietosarja on: R: lle sopiva ARIMA (0,1,1) antoi MA (1) - kertoimen 0,3877. Näin ollen (11) 1.3877 ja 1- -0.3877. Eksponentiaalisen tasausennusteen yhtälö on hattu 1.3877xt - 0.3877hat t At time 100, sarjan havaittu arvo on x 100 0.86601. Tämänhetkisen sarjan ennustettu arvo on siis ajan 101 ennuste hattu 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 Seuraavassa on, kuinka hyvin sileämpi sopii sarjaan. Se on hyvä sovitus. Tämä on hyvä merkki ennakointiin, jonka tärkein tarkoitus on sileämpi. Seuraavassa on esimerkkejä tämän esimerkin lähdön generoimiseksi: oilindex scan (oildata. dat) - viiva (öljynindeksi, tyyppi b, öljyindeksin päälogi) expsmoothfit arima (öljynindeksi, järjestys c (0,1,1)) expsmoothfit nähdä arima tuloksia ennustaa öljynindeksi - expsmoothfitresiduals ennustettu arvot tontti (oilindex, typeb, pää Exponential Smoothing log of Oil Index) linjat (ennustaa) 1.3877oilindex100-0.3877predicteds100 ennuste ajan 101 Double Exponential Smoothing Kaksinkertainen eksponentti tasoitus voidaan käyttää, kun Theres (joko pitkällä tai lyhyellä aikavälillä), mutta ei kausivaihtelua. Pohjimmiltaan menetelmä luo ennusteen yhdistämällä eksponentiaalisesti tasoitettuja estimaatteja trendistä (suoran kulmakerroin) ja tasosta (pohjimmiltaan suora viiva). Kaksi eri painoa tai tasoittavaa parametria käytetään näiden kahden komponentin päivittämiseen joka kerta. Tasoitettu taso on enemmän tai vähemmän vastaava datan arvojen yksinkertaisen eksponentiaalisen tasoituksen kanssa ja tasoitettu suuntaus vastaa enemmän tai vähemmän vastaaviin eroihin perustuvaa yksinkertaista eksponentiaalista tasoitusta. Toimenpide vastaa ARIMA (0,2,2) - mallin asentamista, ilman vakioa ARIMA (0,2,2) sopivuudella. (1-B) 2'xt (1-thetaBB theta2B2) wt. NavigationSmoothing-tiedot poistavat satunnaisvaihtelut ja näyttävät trendejä ja syklisiä komponentteja. Ajan kertyneen tiedon kerääminen on jonkinlaista satunnaisvaihtelua. On olemassa menetelmiä satunnaisvaihtelun vaikutuksen kumoamisen vähentämiseksi. Teollisuudessa usein käytetty tekniikka tasoittaa. Tämä tekniikka, kun sitä käytetään oikein, paljastaa selkeämmin taustalla olevan trendin, kausittaiset ja sykliset komponentit. On olemassa kaksi erillistä tasoitusmenetelmää. Keskimääräiset menetelmät Eksponentiaaliset tasoitusmenetelmät Keskimäärän ottaminen on yksinkertaisin tapa tasoittaa tietoja Ensin tutkitaan joitain keskiarvoistamismenetelmiä, kuten kaikkien aiempien tietojen yksinkertainen keskiarvo. Varastonhoitaja haluaa tietää, kuinka paljon tyypillinen toimittaja toimittaa 1000 dollarin yksiköissä. Heshe ottaa näytteen 12 toimittajalta satunnaisesti ja saa seuraavat tulokset: Tietojen laskennallinen keskiarvo tai keskimääräinen keskiarvo 10. Päällikkö päättää käyttää tätä tyypillisen toimittajan menojen arviointina. Onko tämä hyvä tai huono arvio? Keskimääräinen neliövirhe on tapa arvioida kuinka hyvä malli on. Me laskemme keskimääräisen neliövirheen. Virheen todellinen summa vähennettynä arvioitu määrä. Virhe neliö on edellä oleva virhe, neliö. SSE on neliövirheiden summa. MSE on neliövirheiden keskiarvo. MSE: n tuloksia esimerkiksi Tulokset ovat: Virhe - ja nelikentävirheet Arvio 10 Kysymys: voimmeko käyttää ennusteiden ennakoitua keskiarvoa, jos epäillään kehitystä Katso alla oleva kaavio osoittaa selvästi, että emme saa tehdä tätä. Yhteenvetona todetaan, että kaikkien aiempien havaintojen yksinkertainen keskiarvo tai keskiarvo on vain arvioitu ennuste, jos ei ole trendiä. Jos on suuntauksia, käytä erilaisia ​​arvioita, jotka huomioivat trendin. Keskimääräinen painaa kaikki aiemmat havainnot yhtä lailla. Esimerkiksi arvojen 3, 4, 5 keskiarvo on 4. Tiedämme tietenkin, että keskiarvo lasketaan lisäämällä kaikki arvot ja jakamalla summa arvojen lukumäärän mukaan. Toinen tapa laskea keskiarvo on lisäämällä jokainen arvo jaettuna arvojen määrällä tai 33 43 53 1 1.3333 1.6667 4. Kerroin 13 kutsutaan painoksi. Yleensä: vasemmanpuoleinen vasen kansi (vasen kylmä) x1 vasen (frac right) x2,. ,, vasen (frac oikealle) xn. (Vasen (frac right)) ovat painoja ja tietenkin ne summaavat yhteen.

No comments:

Post a Comment