Analisi delle serie temporali per la previsione del traffico. Analisi e previsione delle serie storiche Previsione e gestione delle analisi delle serie storiche

Le tre note precedenti descrivono modelli di regressione che prevedono la risposta dai valori delle variabili esplicative. In questo post, mostriamo come utilizzare questi modelli e altre tecniche statistiche per analizzare i dati raccolti su intervalli di tempo successivi. Sulla base delle specifiche di ciascuna società menzionata nello scenario, prenderemo in considerazione tre approcci alternativi all'analisi delle serie temporali.

Il materiale verrà illustrato con un esempio trasversale: prevedere il reddito di tre società... Immagina di essere un analista per una grande società finanziaria. Per valutare le prospettive di investimento dei tuoi clienti, devi prevedere i guadagni di tre società. Per fare ciò, hai raccolto dati su tre società di tuo interesse: Eastman Kodak, Cabot Corporation e Wal-Mart. Poiché le aziende differiscono nel tipo di attività commerciale, ogni serie temporale ha le sue caratteristiche uniche. Pertanto, per la previsione è necessario utilizzare modelli diversi. Come scegliere il miglior modello di previsione per ogni azienda? Come valutare le prospettive di investimento in base ai risultati previsionali?

La discussione inizia con un'analisi dei dati annuali. Vengono dimostrati due metodi per smussare tali dati: media mobile e livellamento esponenziale. Viene quindi illustrata la procedura per il calcolo della tendenza utilizzando il metodo dei minimi quadrati e metodi di previsione più sofisticati. Infine, questi modelli vengono estesi a serie temporali basate su dati mensili o trimestrali.

Scarica una nota in formato o, esempi in formato

Previsione nel mondo degli affari

Poiché le condizioni economiche cambiano nel tempo, i manager devono prevedere l'impatto che questi cambiamenti avranno sulla loro azienda. La previsione è uno dei metodi per garantire una pianificazione accurata. Nonostante il gran numero di metodi sviluppati, tutti perseguono lo stesso obiettivo: prevedere gli eventi che si verificheranno in futuro per tenerne conto durante lo sviluppo di piani e strategie per lo sviluppo dell'azienda.

La società moderna ha costantemente bisogno di previsioni. Ad esempio, per formulare la giusta politica, i membri del governo devono prevedere i livelli di disoccupazione, inflazione, produzione industriale, imposte sul reddito personale e aziendale. Per determinare le esigenze di attrezzature e personale, i direttori delle compagnie aeree devono prevedere correttamente il volume dei viaggi aerei. Per creare un numero sufficiente di dormitori, gli amministratori di college o università vogliono sapere quanti studenti saranno ammessi nella loro istituzione nel prossimo anno.

Esistono due approcci generalmente accettati alla previsione: qualitativo e quantitativo. I metodi di previsione qualitativa sono particolarmente importanti quando i dati quantitativi non sono disponibili per il ricercatore. In genere, questi metodi sono altamente soggettivi. Se sono disponibili statistiche sulla storia dell'oggetto della ricerca, dovrebbero essere utilizzati metodi di previsione quantitativa. Questi metodi consentono di prevedere lo stato di un oggetto in futuro in base ai dati sul suo passato. I metodi di previsione quantitativa si dividono in due categorie: analisi di serie temporali e metodi di analisi causale.

Serie storica è un insieme di dati numerici acquisiti in periodi di tempo consecutivi. L'analisi delle serie temporali consente di prevedere il valore di una variabile numerica in base ai suoi valori passati e presenti. Ad esempio, i prezzi delle azioni giornaliere sulla Borsa di New York formano una serie temporale. Un altro esempio di serie temporale è l'IPC mensile, il prodotto interno lordo trimestrale e il fatturato annuo delle vendite di un'azienda.

Metodi per l'analisi delle relazioni causaliconsentono di determinare quali fattori influenzano i valori della variabile prevista. Questi includono metodi di analisi di regressione multipla con variabili in ritardo, modelli econometrici, analisi di indicatori anticipatori, metodi di analisi di indici di diffusione e altri indicatori economici. Parleremo solo di metodi di previsione basati sull'analisi del tempo. sx righe.

Componenti del modello temporale moltiplicativo classico sx righe

L'assunto principale alla base dell'analisi delle serie temporali è il seguente: i fattori che influenzano l'oggetto in studio nel presente e il passato lo influenzeranno in futuro. Pertanto, gli obiettivi principali dell'analisi delle serie temporali sono identificare ed evidenziare i fattori importanti per la previsione. Per raggiungere questo obiettivo, sono stati sviluppati molti modelli matematici per studiare le fluttuazioni dei componenti inclusi nel modello delle serie temporali. Probabilmente il più comune è il classico modello moltiplicativo per i dati annuali, trimestrali e mensili. Per dimostrare il classico modello moltiplicativo delle serie temporali, si consideri i dati sugli utili effettivi di Wm.Wrigley Jr. Società per il periodo dal 1982 al 2001 (Fig.1).

Figura: 1. Un grafico del reddito lordo effettivo di Wm.Wrigley Jr. Società (milioni di dollari a prezzi correnti) dal 1982 al 2001

Come puoi vedere, negli ultimi 20 anni, il reddito lordo effettivo dell'azienda ha registrato una tendenza al rialzo. Questa tendenza a lungo termine è chiamata tendenza. Tendenzanon è l'unico componente della serie temporale. Inoltre, i dati hanno componenti cicliche e irregolari. Ciclico componente descrive le fluttuazioni dei dati su e giù, spesso in correlazione con i cicli economici. La sua durata varia da 2 a 10 anni. Anche l'intensità o l'ampiezza della componente ciclica non è costante. In alcuni anni, i dati possono essere superiori al valore previsto dalla tendenza (cioè, essere in prossimità del picco del ciclo), e in altri anni, inferiori (cioè, essere alla fine del ciclo). Qualsiasi dato osservato che non si trova sulla curva di tendenza e non obbedisce a una relazione ciclica è chiamato irregolare o componenti casuali... Se i dati vengono registrati giornalmente o trimestralmente, viene chiamato un componente aggiuntivo di stagione... Tutti i componenti delle serie storiche tipiche delle applicazioni economiche sono mostrati in Fig. 2.

Figura: 2. Fattori che influenzano le serie storiche

Il classico modello moltiplicativo delle serie temporali afferma che qualsiasi valore osservato è il prodotto dei componenti elencati. Se i dati sono annuali, osservazione Y iocorrispondente io-esimo anno, è espresso dall'equazione:

(1) Y i = T i* C i* Io io

dove T i - valore di tendenza, C i io-esimo anno, Io io ioanno.

Se i dati vengono misurati mensilmente o trimestralmente, l'osservazione Y icorrispondente all'i-esimo periodo è espresso dall'equazione:

(2) Y io \u003d T io * S io * C io * io io

dove T i - valore di tendenza, S i è il valore della componente stagionale in io-esimo periodo, C i è il valore della componente ciclica in io-esimo periodo, Io io è il valore della componente casuale in io-esimo periodo.

Nella prima fase dell'analisi delle serie temporali, i dati vengono tracciati e viene rivelata la loro dipendenza dal tempo. Innanzitutto, è necessario scoprire se c'è un aumento o una diminuzione a lungo termine dei dati (cioè una tendenza) o se la serie temporale fluttua attorno a una linea orizzontale. Se non è presente alcuna tendenza, è possibile utilizzare la media mobile o il livellamento esponenziale per uniformare i dati.

Livellamento delle serie storiche annuali

Nella sceneggiatura abbiamo menzionato Cabot Corporation. Con sede a Boston, Massachusetts, è specializzata nella produzione e commercializzazione di prodotti chimici, materiali da costruzione, prodotti della chimica fine, semiconduttori e gas naturale liquefatto. L'azienda ha 39 stabilimenti in 23 paesi. La società ha un valore di mercato di circa 1,87 miliardi di dollari e le sue azioni sono quotate alla Borsa di New York con l'acronimo CBT. I ricavi della società per il periodo specificato sono mostrati in Fig. 3.

Figura: 3. Ricavi di Cabot Corporation nel 1982-2001 (miliardi di dollari)

Come puoi vedere, la tendenza al rialzo a lungo termine del reddito è oscurata da un gran numero di fluttuazioni. Pertanto, l'analisi visiva del grafico non ci consente di affermare che i dati sono in trend. In tali situazioni, è possibile applicare la media mobile o le tecniche di livellamento esponenziale.

Medie mobili.Il metodo della media mobile è molto soggettivo e dipende dalla durata del periodo Lselezionato per il calcolo delle medie. Per escludere le fluttuazioni cicliche, la durata del periodo deve essere un multiplo intero della durata media del ciclo. Medie mobili per un periodo di lunghezza selezionato L, formano una sequenza di medie calcolate per sequenze di lunghezza L... Le medie mobili sono indicate dai simboli MA (L).

Supponiamo di voler calcolare le medie mobili di cinque anni dai dati misurati n \u003d 11 anni. Nella misura in cui L \u003d 5, le medie mobili quinquennali formano una sequenza di medie calcolate da cinque valori consecutivi delle serie temporali. La prima delle medie mobili quinquennali viene calcolata sommando i primi cinque anni e poi dividendo per cinque:

La seconda media mobile quinquennale viene calcolata sommando i dati per gli anni da 2 a 6 e quindi dividendo per cinque:

Questo processo continua fino a quando non viene calcolata una media mobile per gli ultimi cinque anni. Lavorando con i dati annuali, si dovrebbe assumere il numero L (la durata del periodo selezionato per il calcolo delle medie mobili) è dispari. In questo caso, è impossibile calcolare le medie mobili per il primo ( L - 1) / 2 e l'ultimo ( L - 12 anni. Pertanto, quando si lavora con medie mobili quinquennali, è impossibile eseguire calcoli per i primi due e gli ultimi due anni. L'anno per il quale viene calcolata la media mobile deve essere nel mezzo di un periodo di lunghezza L... Se una n \u003d 11, a L \u003d 5, la prima media mobile deve corrispondere al terzo anno, la seconda al quarto e l'ultima al nono. Nella fig. 4 mostra i grafici delle medie mobili a 3 e 7 anni calcolate per gli utili di Cabot Corporation dal 1982 al 2001.

Figura: 4. Grafici delle medie mobili a 3 e 7 anni, calcolati per il reddito di Cabot Corporation

Si noti che i valori osservati per il primo e l'ultimo anno vengono ignorati quando si calcolano le medie mobili su tre anni. Allo stesso modo, quando si calcolano le medie mobili su sette anni, non ci sono risultati per il primo e gli ultimi tre anni. Inoltre, le medie mobili su 7 anni rendono le serie temporali molto più uniformi rispetto a quelle su 3 anni. Questo perché la media mobile di 7 anni ha un periodo più lungo. Sfortunatamente, più lungo è il periodo, meno medie mobili possono essere calcolate e presentate sul grafico. Pertanto, non è desiderabile scegliere più di sette anni per il calcolo delle medie mobili, poiché troppi punti cadranno dall'inizio e dalla fine del grafico, il che distorcerà la forma delle serie temporali.

Livellamento esponenziale.Il livellamento esponenziale viene utilizzato per identificare le tendenze a lungo termine che caratterizzano le modifiche dei dati, ad eccezione delle medie mobili. Questo metodo consente anche di fare previsioni a breve termine (entro un periodo), quando l'esistenza di tendenze a lungo termine è discutibile. Per questo motivo, il metodo di livellamento esponenziale ha un vantaggio significativo rispetto al metodo della media mobile.

Il metodo di livellamento esponenziale prende il nome da una sequenza di medie mobili ponderate esponenzialmente. Ciascun valore in questa sequenza dipende da tutti i precedenti valori osservati. Un altro vantaggio del metodo di livellamento esponenziale rispetto al metodo della media mobile è che quando si utilizza quest'ultimo, alcuni valori vengono scartati. Con il livellamento esponenziale, i pesi assegnati ai valori osservati diminuiscono nel tempo, quindi dopo aver eseguito il calcolo, i valori più comuni vengono pesati di più e quelli meno frequenti di meno. Nonostante l'enorme quantità di calcoli, Excel consente di implementare il metodo di livellamento esponenziale.

Un'equazione che appiattisce una serie temporale su un periodo di tempo arbitrario io, contiene tre membri: il valore corrente osservato Y io, appartenente alla serie temporale, valore precedente livellato in modo esponenziale E io –1 e peso assegnato W.

(3) E 1 \u003d Y 1 E i \u003d WY i + (1 - W) E i - 1, i \u003d 2, 3, 4, ...

dove E io - il valore della serie livellata esponenzialmente, calcolato per io-esimo periodo, E i –1 - il valore della serie livellata esponenzialmente, calcolato per ( io - 1) -go periodo, Y i - il valore osservato delle serie temporali in io-esimo periodo, W - peso soggettivo, o coefficiente di livellamento (0< W < 1).

La scelta del fattore di livellamento, o peso assegnato ai membri della serie, è fondamentale perché influisce direttamente sul risultato. Sfortunatamente, questa scelta è in qualche modo soggettiva. Se il ricercatore vuole solo escludere fluttuazioni cicliche o casuali indesiderate dalle serie temporali, dovrebbero essere scelti valori piccoli W (vicino allo zero). D'altra parte, se per la previsione viene utilizzata una serie temporale, è necessario scegliere un peso elevato W (vicino a uno). Nel primo caso, le tendenze a lungo termine nelle serie temporali si manifestano chiaramente. Nel secondo caso, aumenta l'accuratezza delle previsioni a breve termine (Fig. 5).

Figura: 5 Grafici di serie temporali livellate esponenzialmente (W \u003d 0,50 e W \u003d 0,25) per i dati sugli utili di Cabot Corporation dal 1982 al 2001; formule di calcolo vedere file Excel

Valore livellato esponenzialmente ottenuto per io-esimo intervallo di tempo può essere utilizzato come stima del valore previsto in ( io+1) -esimo intervallo:

Prevedere i ricavi di Cabot Corporation nel 2002 sulla base di una serie temporale esponenzialmente livellata corrispondente al peso W \u003d 0,25, è possibile utilizzare il valore livellato calcolato per il 2001. Figura. La figura 5 mostra che questo valore è pari a 1.651,0 milioni di dollari. Quando i dati sui ricavi dell'azienda nel 2002 saranno disponibili, possiamo applicare l'equazione (3) e prevedere il livello dei ricavi nel 2003 utilizzando il valore livellato dei ricavi nel 2002:

Pacchetto di analisi Excel è in grado di tracciare un livellamento esponenziale con un clic. Vai nel menu DatiAnalisi dei dati e seleziona l'opzione Livellamento esponenziale (fig.6). Nella finestra aperta Livellamento esponenziale impostare i parametri. Sfortunatamente, la procedura ti permette di costruire solo una riga smussata, quindi se vuoi giocare con il parametro W, ripetere la procedura.

Figura: 6. Tracciare il livellamento esponenziale utilizzando il pacchetto di analisi

Trend e previsioni dei minimi quadrati

Tra le componenti delle serie storiche, la tendenza è più spesso studiata. È il trend che ti permette di fare previsioni a breve e lungo termine. Per identificare una tendenza a lungo termine in una serie temporale, viene solitamente costruito un grafico su cui vengono tracciati i dati osservati (valori della variabile dipendente) sull'asse verticale e intervalli di tempo (valori della variabile indipendente) sono tracciati sull'asse orizzontale. In questa sezione viene descritta la procedura per rilevare tendenze lineari, quadratiche ed esponenziali utilizzando il metodo dei minimi quadrati.

Modello di tendenza lineareè il modello più semplice utilizzato per la previsione: Y i = β 0 + β 1 X i + ε i. Equazione della tendenza lineare:

Per un dato livello di significatività α, l'ipotesi nulla viene rifiutata se il test t-statistica superiore al livello critico superiore o inferiore al livello critico inferiore t-distribuzione. In altre parole, la regola decisionale è formulata come segue: se t > t U o t < t L, ipotesi nulla H 0 viene rifiutata, altrimenti l'ipotesi nulla non viene rifiutata (Fig. 14).

Figura: 14. Aree di rigetto di ipotesi per il test bilaterale della significatività del parametro autoregressivo A ravendo l'ordine più alto

Se l'ipotesi nulla ( A r \u003d 0) non rifiuta, il che significa che il modello selezionato contiene troppi parametri. Il criterio consente di eliminare il membro senior del modello e valutare il modello di ordine autoregressivo p - 1... Questa procedura dovrebbe essere continuata fino all'ipotesi nulla H 0 non sarà rifiutato.

  1. Seleziona l'ordine r del modello autoregressivo stimato, tenendo conto di ciò t- il criterio di significatività ha n–2p - 1 gradi di libertà.
  2. Forma una sequenza di variabili r "In ritardo" in modo che la prima variabile sia ritardata di un intervallo di tempo, la seconda di due e così via. L'ultimo valore dovrebbe essere ritardato di r intervalli di tempo (vedi Fig.15).
  3. Applicare Pacchetto di analisiExcel per calcolare un modello di regressione contenente tutti i file r valori di serie temporali ritardati.
  4. Stimare il significato del parametro A R, avendo l'ordine più alto: a) se l'ipotesi nulla viene rifiutata, il modello autoregressivo può includere tutto r parametri; b) se l'ipotesi nulla non viene rifiutata, scartare r-esima variabile e ripetere i passaggi 3 e 4 per un nuovo modello che include p - 1 parametro. La convalida del significato del nuovo modello si basa su t-criteri, il numero di gradi di libertà è determinato dal nuovo numero di parametri.
  5. Ripetere i passaggi 3 e 4 fino a quando il termine senior del modello autoregressivo diventa statisticamente significativo.

Per dimostrare la modellazione autoregressiva, torniamo all'analisi delle serie storiche dei guadagni reali dell'azienda Wm. Wrigley Jr. Nella fig. 15 mostra i dati necessari per costruire modelli autoregressivi di primo, secondo e terzo ordine. Tutte le colonne di questa tabella sono necessarie per creare un modello di terzo ordine. Quando si crea un modello autoregressivo di secondo ordine, l'ultima colonna viene ignorata. Quando si crea un modello autoregressivo del primo ordine, le ultime due colonne vengono ignorate. Pertanto, quando si costruiscono modelli autoregressivi del primo, secondo e terzo ordine, uno, due e tre sono esclusi rispettivamente da 20 variabili.

La scelta del modello autoregressivo più accurato inizia con un modello di terzo ordine. Per un lavoro corretto Pacchetto di analisi seguito come intervallo di input Y specificare l'intervallo B5: B21 e l'intervallo di input per X - C5: E21. I dati dell'analisi sono mostrati in Fig. 16.

Verificare il significato del parametro A 3avendo l'ordine più alto. La sua valutazione a 3 è –0,006 (cella C20 nella Figura 16) e l'errore standard è 0,326 (cella D20). Per verificare le ipotesi H 0: A 3 \u003d 0 e H 1: A 3 ≠ 0, calcoliamo t-statistiche:

t-criteri con n - 2p - 1 \u003d 20–2 * 3–1 \u003d 13 gradi di libertà sono uguali: t L \u003d STUDENT.OBR (0,025; 13) \u003d –2,160; t U \u003d STUDENT.OBR (0.975,13) \u003d +2.160. Dal -2.160< t = –0,019 < +2,160 и r \u003d 0,985\u003e α \u003d 0,05, ipotesi nulla H 0 non può essere rifiutato. Pertanto, il parametro del terzo ordine non ha rilevanza statistica nel modello autoregressivo e dovrebbe essere rimosso.

Ripetiamo l'analisi per il modello autoregressivo del secondo ordine (Fig. 17). Stima del parametro di ordine più elevato a 2 \u003d –0,205 e il suo errore standard è 0,276. Per verificare le ipotesi Í 0: А 2 \u003d 0 e Í 1: А 2 ≠ 0 calcoliamo t-statistiche:

Al livello di significatività α \u003d 0,05, i valori critici del bidirezionale t-criteri con n - 2p - 1 \u003d 20–2 * 2–1 \u003d 15 gradi di libertà sono uguali: t L \u003d STUDENT.OBR (0,025; 15) \u003d –2,131; t U \u003d STUDENT.OBR (0,975; 15) \u003d +2,131. Dal –2.131< t = –0,744 < –2,131 и r \u003d 0,469\u003e α \u003d 0,05, ipotesi nulla H 0 non può essere rifiutato. Pertanto, il parametro del secondo ordine non è statisticamente significativo e dovrebbe essere rimosso dal modello.

Ripetiamo l'analisi per il modello autoregressivo del primo ordine (Fig. 18). Stima del parametro di ordine più elevato a 1 \u003d 1.024 e il suo errore standard è 0,039. Per verificare le ipotesi H 0: A 1 \u003d 0 e H 1: A 1 ≠ 0, calcoliamo t-statistiche:

Al livello di significatività α \u003d 0,05, i valori critici del bidirezionale t-criteri con n - 2p - 1 \u003d 20–2 * 1–1 \u003d 17 gradi di libertà sono uguali: t L \u003d STUDENT.OBR (0,025; 17) \u003d –2,110; t U \u003d STUDENT.OBR (0,975; 17) \u003d +2,110. Dal -2.110< t = 26,393 < –2,110 и r = 0,000 < α = 0,05, нулевую гипотезу H 0 dovrebbe essere rifiutato. Pertanto, il parametro del primo ordine è statisticamente significativo e non può essere rimosso dal modello. Quindi, il modello autoregressivo del primo ordine è la migliore approssimazione dei dati originali. Utilizzando stime uno 0 = 18,261, a 1 \u003d 1.024 e il valore delle serie storiche dell'ultimo anno - Y 20 \u003d 1 371,88, si può prevedere il valore del reddito reale dell'azienda Wm. Wrigley Jr. Azienda nel 2002:

Scegliere un modello di previsione adeguato

Sei metodi per prevedere i valori delle serie temporali sono stati descritti sopra: modelli di trend lineari, quadratici ed esponenziali e modelli autoregressivi del primo, secondo e terzo ordine. Esiste un modello ottimale? Quale dei sei modelli descritti dovrebbe essere utilizzato per prevedere il valore delle serie temporali? Di seguito sono elencati quattro principi che dovrebbero guidare la selezione di un modello di previsione adeguato. Questi principi si basano su stime dell'accuratezza del modello. Si presume che i valori delle serie temporali possano essere previsti studiando i suoi valori precedenti.

Principi per la scelta dei modelli per la previsione:

  • Eseguire l'analisi dei residui.
  • Stimare l'errore residuo utilizzando le differenze al quadrato.
  • Stimare l'entità dell'errore residuo utilizzando differenze assolute.
  • Lasciati guidare dal principio di economia.

Analisi residua.Ricorda che il residuo è la differenza tra i valori previsti e osservati. Dopo aver costruito un modello per le serie temporali, è necessario calcolare i residui per ciascuno di n intervalli. Come mostrato in fig. 19, riquadro A, se il modello è adeguato, i residui rappresentano una componente casuale delle serie storiche e sono quindi distribuiti in modo irregolare. D'altra parte, come mostrato nei pannelli rimanenti, se il modello non è adeguato, i residui possono avere un rapporto sistematico che non tiene conto né dell'andamento (pannello B), né del ciclico (pannello C), né della stagionalità componente (pannello D).

Figura: 19. Analisi dei residui

Misura degli errori residui assoluti e radice quadrata.Se l'analisi dei residui non consente di determinare l'unico modello adeguato, è possibile utilizzare altri metodi basati sulla stima dell'entità dell'errore residuo. Purtroppo gli statistici non hanno raggiunto un consenso sulla migliore stima degli errori residui dei modelli utilizzati per la previsione. In base al principio dei minimi quadrati, è possibile eseguire prima un'analisi di regressione e calcolare l'errore standard della stima S XY... Quando si analizza un modello specifico, questo valore è la somma dei quadrati delle differenze tra i valori effettivi e previsti delle serie temporali. Se il modello si adatta perfettamente ai valori delle serie temporali in momenti precedenti, l'errore standard della stima è zero. D'altra parte, se il modello approssima scarsamente i valori delle serie temporali in momenti precedenti, l'errore standard della stima è grande. Quindi, analizzando l'adeguatezza di più modelli, è possibile selezionare un modello che ha un errore standard minimo della stima S XY.

Il principale svantaggio di questo approccio è l'esagerazione degli errori nella previsione dei valori individuali. In altre parole, qualsiasi grande differenza tra le quantità Y io e Ŷ io quando si calcola la somma degli errori al quadrato, l'SE è al quadrato, ad es. aumenta. Per questo motivo, molti statistici preferiscono utilizzare la deviazione assoluta media (MAD) per valutare l'adeguatezza di un modello di previsione:

Quando si analizzano modelli specifici, il valore MAD è il valore medio dei valori assoluti delle differenze tra i valori effettivi e previsti delle serie temporali. Se il modello si adatta perfettamente ai valori delle serie temporali nei punti temporali precedenti, la deviazione assoluta media è zero. D'altra parte, se il modello approssima scarsamente tali valori di serie temporali, la deviazione assoluta media è grande. Quindi, analizzando l'adeguatezza di più modelli, è possibile scegliere un modello che abbia la deviazione assoluta media minima.

Il principio di economia.Se l'analisi degli errori standard delle stime e delle deviazioni medie assolute non consente di determinare il modello ottimale, è possibile utilizzare il quarto metodo, basato sul principio di economia. Questo principio afferma che il più semplice dovrebbe essere scelto tra diversi modelli uguali.

Dei sei modelli di previsione discussi in questo capitolo, i più semplici sono i modelli di regressione lineare e quadratica, nonché il modello autoregressivo del primo ordine. Gli altri modelli sono molto più complessi.

Confronto di quattro metodi di previsione.Per illustrare il processo di scelta del modello ottimale, torniamo alle serie storiche costituite dai valori del reddito reale della società Wm. Wrigley Jr. Azienda. Confrontiamo quattro modelli: modelli lineari, quadratici, esponenziali e autoregressivi del primo ordine. (I modelli autoregressivi del secondo e terzo ordine migliorano solo leggermente l'accuratezza della previsione dei valori di una data serie temporale, quindi possono essere ignorati.) 20 mostra i grafici dei residui costruiti analizzando quattro metodi di previsione utilizzando Pacchetto di analisi Eccellere. Bisogna fare attenzione quando si traggono conclusioni da questi grafici, poiché la serie temporale contiene solo 20 punti. Per i metodi di costruzione, vedere il foglio corrispondente nel file Excel.

Figura. 20. Grafici dei residui costruiti analizzando quattro metodi di previsione utilizzando Pacchetto di analisi Eccellere

Nessun modello diverso dal modello autoregressivo del primo ordine tiene conto della componente ciclica. È questo modello che approssima le osservazioni meglio di altri ed è caratterizzato dalla struttura meno sistematica. Quindi, l'analisi dei residui di tutti e quattro i metodi ha mostrato che il modello autoregressivo del primo ordine è il migliore e che i modelli lineare, quadratico ed esponenziale hanno una precisione inferiore. Per esserne convinti, confrontiamo i valori degli errori residui di questi metodi (Fig. 21). Puoi familiarizzare con il metodo di calcolo aprendo il file Excel. Nella fig. 21 sono valori effettivi Y i (altoparlante Reddito reale), valori previsti Ŷ iocosì come gli avanzi e io per ciascuno dei quattro modelli. Inoltre, i valori S YX e PAZZO... Per tutti e quattro i modelli, le quantità S YX e PAZZO piu 'o meno lo stesso. Il modello esponenziale è relativamente inferiore, mentre i modelli lineare e quadratico hanno una precisione superiore. Come previsto, i valori più piccoli S YX e PAZZO ha un modello autoregressivo di primo ordine.

Figura. 21. Confronto di quattro metodi di previsione utilizzando gli indicatori S YX e MAD

Avendo scelto un modello di previsione specifico, è necessario monitorare da vicino ulteriori cambiamenti nelle serie temporali. Tra le altre cose, un tale modello viene creato per prevedere correttamente i valori delle serie temporali in futuro. Sfortunatamente, tali modelli di previsione tengono in scarsa considerazione i cambiamenti nella struttura delle serie temporali. È assolutamente necessario confrontare non solo l'errore residuo, ma anche l'accuratezza della previsione dei valori futuri delle serie storiche ottenute con l'ausilio di altri modelli. Dopo aver misurato il nuovo valore Y io nell'intervallo di tempo osservato, deve essere immediatamente confrontato con il valore previsto. Se la differenza è troppo grande, il modello di previsione dovrebbe essere rivisto.

Tempo di previsione sserie x basata su dati stagionali

Finora abbiamo studiato una serie temporale composta da dati annuali. Tuttavia, molte serie temporali sono composte da quantità misurate trimestralmente, mensilmente, settimanalmente, quotidianamente e persino ogni ora. Come mostrato in fig. 2, se i dati sono misurati mensilmente o trimestralmente, va considerata la componente stagionale. In questa sezione, esamineremo i metodi per prevedere i valori di tali serie temporali.

Lo scenario all'inizio del capitolo si riferiva a Wal-Mart Stores, Inc. La società ha una capitalizzazione di mercato di $ 229 miliardi e le sue azioni sono quotate alla Borsa di New York con l'acronimo WMT. L'anno fiscale della società termina il 31 gennaio, quindi il quarto trimestre del 2002 include novembre e dicembre 2001 e gennaio 2002. La serie storica dei ricavi trimestrali della società è mostrata in Fig. 22.

Figura. 22. Wal-Mart Stores, Inc. Ricavi trimestrali (Milioni di dollari)

Per serie trimestrali come questa, il modello moltiplicativo classico, oltre alle componenti trend, cicliche e casuali, contiene una componente stagionale: Y i = T i* S i* C i* Io io

Prevedere le mestruazioni e il tempo sx righe utilizzando il metodo dei minimi quadrati.Il modello di regressione con una componente stagionale si basa su un approccio combinato. Per calcolare la tendenza, viene utilizzato il metodo dei minimi quadrati descritto in precedenza e per tenere conto della componente stagionale - la variabile categoriale (per maggiori dettagli, vedere la sezione Modelli di regressione fittizia ed effetti di interazione). Un modello esponenziale viene utilizzato per approssimare le serie temporali con componenti stagionali. In un modello che approssima una serie temporale trimestrale, avevamo bisogno di tre variabili fittizie per tenere conto di quattro trimestri Q 1, Q 2 e Q 3e nel modello per una serie temporale mensile, 12 mesi sono rappresentati utilizzando 11 variabili fittizie. Poiché questi modelli utilizzano la variabile log Y i, ma no Y i, per calcolare i coefficienti di regressione reali, è necessario eseguire la trasformazione inversa.

Per illustrare il processo di creazione di un modello di serie temporale trimestrale, torniamo ai guadagni di Wal-Mart. I parametri del modello esponenziale ottenuti utilizzando Pacchetto di analisi Excel sono mostrati in Fig. 23.

Figura: 23. Analisi di regressione degli utili trimestrali di Wal-Mart Stores, Inc.

Si può vedere che il modello esponenziale approssima abbastanza bene i dati originali. Coefficiente di correlazione misto r 2 è 99,4% (celle J5), il coefficiente di correlazione mista corretto è 99,3% (celle J6), test F-statistica - 1.333,51 (celle M12) e r-valore è 0,0000. A un livello di significatività di α \u003d 0,05, ciascun coefficiente di regressione nel modello classico delle serie temporali moltiplicative è statisticamente significativo. Applicando loro l'operazione di potenziamento, otteniamo i seguenti parametri:

Probabilità sono interpretati come segue.

Utilizzo dei coefficienti di regressione b i, puoi prevedere il reddito ricevuto dall'azienda in un determinato trimestre. Ad esempio, prevediamo le entrate della società per il quarto trimestre del 2002 ( X io = 35):

log \u003d b 0 + b 1 X io = 4,265 + 0,016*35 = 4,825

= 10 4,825 = 66 834

Pertanto, secondo le previsioni nel quarto trimestre 2002, la società avrebbe dovuto incassare un fatturato pari a 67 miliardi di dollari (difficilmente si dovrebbe fare una previsione al milione più vicino). Al fine di estendere la previsione per un periodo di tempo al di fuori delle serie temporali, ad esempio, per il primo trimestre del 2003 ( X io = 36, Q 1 \u003d 1), è necessario eseguire i seguenti calcoli:

log Ŷ i = b 0 + b 1X io + b 2 Q 1 = 4,265 + 0,016*36 – 0,093*1 = 4,748

10 4,748 = 55 976

Indici

Gli indici sono utilizzati come indicatori che rispondono ai cambiamenti della situazione economica o dell'attività aziendale. Esistono numerosi tipi di indici, come indici di prezzo, indici quantitativi, indici di valore e indici sociologici. In questa sezione considereremo solo l'indice dei prezzi. Indice - il valore di un indicatore economico (o di un gruppo di indicatori) in un determinato momento, espresso come percentuale del suo valore nel punto base nel tempo.

Indice dei prezzi.Un semplice indice di prezzo riflette la variazione percentuale del prezzo di un prodotto (o gruppo di prodotti) in un dato periodo di tempo rispetto al prezzo di quel prodotto (o gruppo di prodotti) in un particolare momento nel passato. Quando si calcola l'indice dei prezzi, prima di tutto, è necessario selezionare un intervallo di tempo di base, un intervallo di tempo nel passato con il quale verranno effettuati i confronti. Quando si sceglie un periodo di base per un indice specifico, i periodi di stabilità economica sono preferibili a periodi di ripresa economica o recessione. Inoltre, la linea di base non dovrebbe essere troppo distante nel tempo, in modo che i risultati del confronto non siano troppo influenzati dai cambiamenti nella tecnologia e nelle abitudini dei consumatori. L'indice dei prezzi viene calcolato utilizzando la formula:

dove Io io - indice dei prezzi in io-il mio orecchio, R io - prezzo in io-il mio orecchio, Basi R. - prezzo nell'anno base.

Indice di prezzo: la variazione percentuale del prezzo di un prodotto (o un gruppo di prodotti) in un dato periodo di tempo in relazione al prezzo di un prodotto in un punto base nel tempo Ad esempio, si consideri l'indice dei prezzi della benzina senza piombo negli Stati Uniti dal 1980 al 2002 (Figura 24). Per esempio:

Figura: 24. Prezzo di un gallone di benzina senza piombo e indice di prezzo semplice negli Stati Uniti dal 1980 al 2002 (anni base: 1980 e 1995)

Quindi, nel 2002, il prezzo della benzina senza piombo negli Stati Uniti era superiore del 4,8% rispetto al 1980. Analisi fig. 24 mostra che l'indice dei prezzi nel 1981 e nel 1982. era superiore all'indice dei prezzi nel 1980 e fino al 2000 non ha superato la linea di base. Dal momento che viene scelto il 1980 come periodo di base, probabilmente ha senso scegliere un anno più vicino, ad esempio, il 1995. La formula per ricalcolare l'indice rispetto al nuovo periodo di tempo di base è:

dove io nuovo - nuovo indice dei prezzi, io vecchio - vecchio indice dei prezzi, io nuovobase - il valore dell'indice dei prezzi nel nuovo anno base quando si calcola per il vecchio anno base.

Supponiamo che il 1995 sia selezionato come nuova base. Usando la formula (10), otteniamo un nuovo indice dei prezzi per il 2002:

Quindi, nel 2002, la benzina senza piombo negli Stati Uniti costava il 13,9% in più rispetto al 1995.

Indici di prezzo compositi non ponderati.Nonostante l'indice di prezzo di un singolo prodotto sia di indubbio interesse, più importante è l'indice di prezzo di un gruppo di beni, che consente di valutare il costo e il tenore di vita di un gran numero di consumatori. L'indice di prezzo composito non ponderato definito dalla formula (11) assegna lo stesso peso a ogni singola merce. Un indice di prezzo composito riflette la variazione percentuale del prezzo di un gruppo di beni (spesso chiamato un paniere di beni) in un dato periodo di tempo in relazione al prezzo di quel gruppo di beni in un punto base nel tempo.

dove t io - numero articolo (1, 2, ..., n), n - il numero di merci nel gruppo in esame, - la somma dei prezzi per ciascuno di n merci nel tempo t, è la somma dei prezzi per ciascuno di n merci nel periodo di tempo zero, è il valore dell'indice composito non ponderato nel periodo di tempo t.

Nella fig. 25 mostra i prezzi medi di tre tipi di frutta per il periodo dal 1980 al 1999. Per calcolare l'indice di prezzo composito non ponderato in diversi anni, viene utilizzata la formula (11), considerando il 1980 come anno base.

Quindi, nel 1999 il prezzo totale di una libbra di mele, una libbra di banane e una libbra di arance era superiore del 59,4% rispetto al prezzo totale di questi frutti nel 1980.

Figura. 25. Prezzi (in dollari) per tre tipi di frutta e un indice di prezzo composito non ponderato

L'indice dei prezzi composito non ponderato esprime le variazioni dei prezzi per un intero gruppo di merci nel tempo. Sebbene questo indice sia facile da calcolare, presenta due distinti svantaggi. Innanzitutto, quando si calcola questo indice, tutti i tipi di beni sono considerati ugualmente importanti, quindi i beni costosi acquisiscono un'influenza non necessaria sull'indice. In secondo luogo, non tutti i beni vengono consumati allo stesso modo, quindi le variazioni di prezzo per i beni a basso consumo hanno un effetto eccessivo sull'indice non ponderato.

Indici di prezzo compositi ponderati.A causa delle carenze degli indici dei prezzi non ponderati, sono preferibili gli indici dei prezzi ponderati, tenendo conto delle differenze nei prezzi e nei livelli di consumo dei beni che formano il paniere dei consumatori. Esistono due tipi di indici di prezzo compositi ponderati. Indice dei prezzi di Lapeyredefinito dalla formula (12) utilizza i livelli di consumo nell'anno di riferimento. L'indice di prezzo composito ponderato tiene conto dei livelli di consumo dei beni che compongono il paniere dei consumatori assegnando un certo peso a ciascun prodotto.

dove t - periodo di tempo (0, 1, 2, ...), io - numero articolo (1, 2, ..., n), n io nel periodo di tempo zero, è il valore dell'indice LaPeyre nel periodo di tempo t.

I calcoli dell'indice di Lapeyre sono mostrati in Fig. 26; 1980 viene utilizzato come riferimento.

Figura: 26. Prezzi (in dollari), quantità (consumo in libbre pro capite) di tre tipi di frutta e indice di LaPeyre

Quindi, l'indice di Lapeyre nel 1999 è 154,2. Ciò indica che nel 1999 questi tre tipi di frutta erano il 54,2% più costosi rispetto al 1980. Si noti che questo indice è inferiore all'indice non ponderato di 159,4, poiché i prezzi delle arance - il frutto consumato di meno - sono aumentati più del prezzo di mele e banane. In altre parole, poiché i prezzi dei frutti più consumati sono aumentati meno dei prezzi delle arance, l'indice di LaPeyret è inferiore all'indice composito non ponderato.

Indice dei prezzi di Paasche utilizza i livelli di consumo del prodotto nel periodo di tempo corrente, non nel periodo di base. Di conseguenza, l'indice di Paasche riflette in modo più accurato il costo totale del consumo di beni in un dato momento. Tuttavia, questo indice presenta due svantaggi significativi. In primo luogo, i livelli di consumo attuali sono generalmente difficili da determinare. Per questo motivo, molti indici popolari utilizzano l'indice LaPeyre anziché l'indice Paasche. In secondo luogo, se il prezzo di un particolare prodotto nel paniere dei consumatori aumenta bruscamente, gli acquirenti riducono il loro consumo per necessità, piuttosto che come risultato di un cambiamento dei gusti. L'indice di Paasche è calcolato dalla formula:

dove t - periodo di tempo (0, 1, 2, ...), io - numero articolo (1, 2, ..., n), n - il numero di merci nel gruppo in esame, - il numero di unità di merci io nel periodo di tempo zero, è il valore dell'indice di Paasche nel periodo di tempo t.

I calcoli dell'indice di Paasche sono mostrati in Fig. 27; 1980 è utilizzato come riferimento.

Figura: 27. Prezzi (in dollari), quantità (consumo in libbre pro capite) di tre tipi di frutta e indice di Paasche

Quindi, l'indice di Paasche nel 1999 è 147,0. Ciò indica che nel 1999 questi tre tipi di frutta erano il 47,0% più costosi rispetto al 1980.

Alcuni popolari indici di prezzo.Diversi indici di prezzo vengono utilizzati nel mondo degli affari e dell'economia. Il più popolare è l'indice dei prezzi al consumo (CPI). Ufficialmente, questo indice si chiama CPI-U per sottolineare che è calcolato per le città (urbane), sebbene di solito sia chiamato semplicemente CPI. Questo indice viene pubblicato mensilmente dall'U. S. Bureau of Labor Statistics come strumento principale per misurare il costo della vita negli Stati Uniti. L'indice dei prezzi al consumo è composto e ponderato secondo il metodo Lapeyre. Viene calcolato utilizzando i prezzi di 400 tra i prodotti, i tipi di abbigliamento, i mezzi di trasporto, i medici e i servizi più consumati più ampiamente consumati. Al momento, nel calcolo di questo indice, il periodo 1982-1984 viene utilizzato come base. (fig.28). Una funzione importante dell'IPC è il suo utilizzo come deflatore. Il CPI viene utilizzato per convertire i prezzi effettivi in \u200b\u200bprezzi reali moltiplicando ciascun prezzo per un fattore di 100 / CPI. I calcoli mostrano che negli ultimi 30 anni il tasso di inflazione medio annuo negli Stati Uniti è stato del 2,9%.

Figura. 28. Dinamica del prezzo dell'indice al consumo; vedere il file Excel per i dettagli completi

Un altro importante indice dei prezzi pubblicato dal Bureau of Labor Statistics è l'indice dei prezzi alla produzione (PPI). Il PPI è un indice composito ponderato che utilizza il metodo Lapeyre per stimare la variazione dei prezzi dei beni venduti dai loro produttori. Il PPI è l'indicatore principale per l'IPC. In altre parole, un aumento del PPI porta ad un aumento del CPI e viceversa, una diminuzione del PPI porta ad una diminuzione del CPI. Indici finanziari come Dow Jones Industrial Average (DJIA), S&P 500 e NASDAQ vengono utilizzati per misurare le variazioni del valore delle azioni statunitensi. Molti indici misurano la redditività dei mercati azionari internazionali. Questi indici includono il Nikkei in Giappone, il Dax 30 in Germania e l'SSE Composite in Cina.

Insidie \u200b\u200bassociate all'analisi dei tempi sx righe

L'importanza di una metodologia che utilizza le informazioni sul passato e sul presente per predire il futuro è stata eloquentemente descritta dallo statista Patrick Henry più di duecento anni fa: “Ho solo una lampada che illumina il percorso: la mia esperienza. Solo la conoscenza del passato ci permette di giudicare il futuro ".

L'analisi delle serie temporali si basa sul presupposto che i fattori che hanno influenzato l'attività aziendale in passato e che influenzano il presente continueranno a funzionare in futuro. Se vero, l'analisi delle serie temporali è uno strumento predittivo e di gestione efficace. Tuttavia, i critici dei metodi classici basati sull'analisi delle serie temporali sostengono che questi metodi sono troppo ingenui e primitivi. In altre parole, un modello matematico che tenga conto dei fattori che hanno operato in passato non dovrebbe estrapolare meccanicamente le tendenze nel futuro senza tenere conto delle valutazioni degli esperti, dell'esperienza aziendale, dei cambiamenti nella tecnologia, nonché delle abitudini e dei bisogni delle persone. Nel tentativo di rimediare a questa situazione, negli ultimi anni, gli econometrici hanno sviluppato sofisticati modelli informatici di attività economica che tengono conto dei fattori sopra elencati.

Tuttavia, i metodi di analisi delle serie temporali sono un eccellente strumento di previsione (sia a breve che a lungo termine) se applicati correttamente, combinati con altri metodi di previsione, nonché il giudizio e l'esperienza degli esperti.

Sommario.In questa nota, utilizzando l'analisi delle serie temporali, sono stati sviluppati modelli per prevedere il reddito di tre società: Wm. Wrigley Jr. Azienda, Cabot Corporation e Wal-Mart. Vengono descritti i componenti delle serie temporali, nonché diversi approcci alla previsione delle serie temporali annuali: il metodo della media mobile, il metodo di livellamento esponenziale, i modelli lineare, quadratico ed esponenziale, nonché il modello autoregressivo. Viene considerato un modello di regressione contenente variabili fittizie corrispondenti alla componente stagionale. Viene mostrata l'applicazione del metodo dei minimi quadrati per la previsione di serie temporali mensili e trimestrali (Fig. 29).

I gradi di libertà P vengono persi quando si confrontano i valori delle serie temporali.

tavolo Eccellere con i dati iniziali è il seguente (Fig. 2.33).

Figura: 2.33. tavolo Eccellere con i dati iniziali

I metodi grafici sono ampiamente utilizzati nell'analisi delle serie temporali. Ciò è dovuto al fatto che la presentazione tabellare delle serie storiche e delle caratteristiche descrittive molto spesso non ci consente di comprendere la natura del processo, e dal grafico delle serie temporali si possono trarre alcune conclusioni, che possono poi essere verificate mediante calcoli . L'analisi grafica di una serie di solito determina la direzione della sua ulteriore analisi.

Seleziona l'intervallo di celle A2: K2 e utilizza il comando Programma schede Inserire (Fig. 2.34), costruiamo un grafico (Fig. 2.35).


Figura: 2.34. Tab Inserire... Squadra Programma

Figura: 2.35. Grafico - Dinamica delle vendite di auto

Prima di inserire la linea di tendenza, procurati altre quattro copie del grafico in modo che ogni tipo di linea di tendenza venga tracciato su un grafico separato. Per inserire una linea di tendenza, fare clic con il pulsante destro del mouse su uno dei valori dei dati del grafico e scegliere Aggiungi linea di tendenzacome mostrato in fig. 2.36.

Figura: 2.36. Squadra Aggiungi linea di tendenza

menù contestuale

Nella finestra di dialogo Formato linea di tendenza (fig. 2.37) si selezionano i tipi di trendline suggeriti e si attivano le opzioni mostra un'equazione in un diagrammae posizionare sul diagramma il valore dell'accuratezza dell'approssimazione.

Figura: 2.37. Parametri della linea di tendenza selezionati

Di conseguenza, otteniamo i seguenti grafici (Fig. 2.38 -2.).

Figura: 2.38. Tipo di linea di tendenza - Lineare

Figura: 2.39. Tipo di linea di tendenza - Logaritmico

Figura: 2.40. Tipo di linea di tendenza - Polinomio

Figura: 2.41. Tipo di linea di tendenza - Energia

Figura: 2.42. Tipo di linea di tendenza - Esponenziale

Come funzione approssimativa, viene scelto un polinomio di secondo grado - una parabola, poiché ha il valore maggiore R 2\u003d 0,9905, in base a questo tipo di trend si costruisce una previsione due passi avanti (Fig. 2.43). Nel nostro esempio, il numero di auto vendute è previsto per 11 e 12 settimane (Fig. 2.44).

Figura: 2.43. La previsione è fissata per due periodi successivi

Figura: 2.44. Previsione per due periodi futuri

Inoltre, per creare una previsione, è possibile utilizzare la funzione statistica incorporata TREND. Riempi l'intervallo di celle L1: M1 rispettivamente con i numeri 11 e 12. Poiché la funzione TREND fornisce un array di risposte, prima di chiamarla, devi selezionare un intervallo di risposte, nel nostro caso L2: M2. Utilizzando il pulsante Procedure guidate di funzione , chiama la finestra di dialogo della funzione e compila i campi degli argomenti, come mostrato in Fig. 2.45.

Figura: 2.45. Funzione statistica TREND

Quando hai finito di inserire la formula: \u003d TREND (B2: K2; B1: K1; L1: M1) premi la combinazione di tasti Ctrl + Maiusc + Invio.

Il risultato del calcolo è mostrato nella seguente fig. 2.46.

Abbiamo ricevuto la seguente previsione: se la società mantiene la dinamica delle vendite di auto, entro 11 settimane venderà 78 auto e entro 12 settimane - 84.

Regressione lineare

La tabella contiene due serie storiche: la prima rappresenta il profitto di una banca commerciale in crescita per trimestri ( Avere), la seconda riga è il tasso di interesse di questa banca per i prestiti a persone giuridiche ( X) per lo stesso periodo (tabella 3).

Necessario:

1. Costruisci un modello di regressione unidirezionale;

2. Stimare il profitto della banca a un dato tasso di interesse (accettato dall'utente in modo indipendente);

3. Visualizzare i dati iniziali e i risultati della simulazione sul grafico.

Tabella 3

Tabella con i dati iniziali in formato Eccellere ha la seguente forma (Fig. 2.47).


Figura: 2.47. Tabella dei dati di origine

Per calcolare i parametri del modello, comporremo una tabella di calcolo della seguente forma (Fig. 2.48).


Figura: 2.48. Tabella di calcolo

La stessa tabella nella modalità di visualizzazione delle formule appare come quella mostrata nella seguente fig. 2.49.


Figura: 2.49. Tabella di calcolo in modalità

visualizzare le formule

Le formule per il calcolo dei parametri sono state introdotte nelle celle C19 e C20 a 1 e uno 0 (fig. 2.50):

Figura: 2.50. Formule dei parametri a 1 e uno 0

I valori dei parametri stessi sono riportati in Fig. 2.51.

Figura: 2.51. Valori dei parametri a 1 e uno 0

Il modello costruito della dipendenza del profitto dal tasso di interesse è il seguente:

Per determinare il profitto quando il tasso di interesse è pari al 30%, è necessario sostituire il valore x nel modello risultante.

La seguente formula è stata inserita nella cella C22 (Figura 2.52):

Figura: 2.52. Formula per calcolare il valore del profitto previsto

Il valore del profitto previsto è di 13 mila rubli. (fig. 2.53).

Figura: 2.53. Previsione del valore del profitto

Calcoliamo la tabella dei residui (Fig. 2.54).


Figura: 2.54. Tabella dei residui

La tabella dei residui nella modalità di visualizzazione delle formule è la seguente (Fig. 2.55).


Figura: 2.55. Tabella dei residui nella modalità di visualizzazione delle formule

La deviazione dalla linea di regressione viene calcolata utilizzando la seguente formula:

Nella cella C38 è stata introdotta una formula per calcolare il valore di deviazione utilizzando la funzione matematica incorporata ROOT (Fig. 2.56).


Figura: 2.56. Funzione matematica incorporata ROOT

La deviazione dalla retta di regressione è 3,4401 (Fig. 2.57).

Figura: 2.57. La quantità di deviazione dalla linea di regressione

Nella fase successiva, vengono calcolati il \u200b\u200blimite superiore della previsione e quello inferiore. Per calcolare l'intervallo di confidenza, useremo la seguente formula:

,

inserito nella cella C40.

Coefficiente t a è un valore di tabella t - Statistiche degli studenti a un dato livello di significatività un e il numero di osservazioni. Se impostiamo la probabilità di ottenere il valore previsto all'interno dell'intervallo di confidenza pari al 90% ( un \u003d 0,01), il numero di gradi di libertà df \u003d 10-1-1, quindi t a=1,8595.

Valore U \u003d 6.804 (fig. 2.58).

Figura: 2.58. Valore dell'intervallo di confidenza

Per calcolare rispettivamente i limiti superiore e inferiore della previsione, inseriamo le formule nelle celle C42 e C43, come mostrato nella Fig. 2.59.

Figura: 2.59. Formule per il calcolo dei limiti di previsione

Il limite superiore della previsione è 19,81 mila rubli, quello inferiore è 6,20 mila rubli. (fig. 2.60).

Figura: 2.60. Valori limite di previsione

Il grafico dei dati iniziali e i risultati della simulazione sono mostrati in Fig. 2.61.

Figura: 2.61. Grafico del modello di regressione accoppiato

Le funzioni statistiche integrate potrebbero essere utilizzate anche per calcolare i parametri del modello, come SLOPE, INTERCEPT, LINEST, STOSE, ecc.

La funzione SLOPE calcola la pendenza della retta di regressione, nel nostro esempio questo è il parametro a 1.

La funzione INTERCETTA calcola il parametro uno 0.

LINEST valuta entrambi questi parametri contemporaneamente. Prima di entrare nella funzione, è necessario selezionare un intervallo di risposte (due celle) e, dopo aver inserito gli argomenti della funzione, premere la combinazione di tasti Ctrl + Maiusc + Invio.

La funzione STOSE calcola l'errore standard, nel nostro esempio è il valore .

La finestra di dialogo della funzione statistica incorporata SLOPE con gli argomenti inseriti è mostrata in Fig. 2.62.


Figura: 2.62. Funzione statistica incorporata SLOPE

La finestra di dialogo della funzione statistica incorporata INTERCEP con gli argomenti inseriti è mostrata in Fig. 2.63.


Figura: 2.63. Funzione statistica incorporata INTERCETTA

La finestra di dialogo della funzione di aggregazione LINEST incorporata con gli argomenti inseriti è mostrata in Fig. 2.64.


Figura: 2.64. Funzione statistica incorporata LINEST

La finestra di dialogo della funzione statistica incorporata STOSHUH con gli argomenti inseriti è mostrata in Fig. 2.65.


Figura: 2.65. Funzione statistica incorporata STOSHUH

Il risultato dei calcoli che utilizzano le funzioni statistiche incorporate è mostrato in Fig. 2.65.


Figura: 2.66. Il risultato di calcoli utilizzando funzioni statistiche integrate

È inoltre possibile utilizzare lo strumento Pacchetto di analisi integrato per creare un modello Regressione... Per fare ciò, nella scheda Dati selezionare squadra Analisi dei dati (fig. 2.67).

Figura: 2.67. Tab Dati... Squadra Analisi dei dati

Nella finestra di dialogo che appare Analisi dei dati seleziona strumento Regressione (fig. 2.68).


Figura: 2.68. Finestra di dialogo Analisi dei dati.

Attrezzo Regressione

Compila gli argomenti della finestra di dialogo Regressionecome mostrato nella Figura 2.69.

Figura: 2.69. Parametri dello strumento Regressione

Eccellere genererà un foglio di report contenente le seguenti tabelle:

· Statistiche di regressione (Fig. 2.70);

Analisi della varianza (Fig. 2.71 - 2.72);

Tabella dei residui (Fig. 2.73),

e traccerà anche i residui (Fig. 2.74).

Figura: 2.70. Statistiche di regressione


Figura: 2.71. ANOVA


Figura: 2.72. Analisi della varianza. Valori coefficienti


Figura: 2.73. Ritirare il resto

Il grafico residuo è il seguente (Fig. 2.74).

Figura: 2.74. Grafico residuo

Quando si esegue questa attività, i valori dei coefficienti dell'equazione di regressione accoppiata a 1 e uno 0sono stati determinati in tre modi: il metodo dei minimi quadrati, utilizzando le funzioni statistiche incorporate e utilizzando lo strumento Regressione... In ogni caso, è stato ottenuto lo stesso risultato, che indica la correttezza del calcolo di questi parametri.

Analisi e previsioni di serie temporali

Centro educativo e metodologico regionale dell'Estremo Oriente (DV RUMT) come libro di testo per studenti in direzione della formazione degli scapoli 080100.62 "Economia" delle università della regione.

Khabarovsk 2013


Analisi e previsioni di serie temporali: un workshop per studenti della laurea triennale in direzione di preparazione 080100.62 "Economics" / comp. I. V. Shokina. - Khabarovsk: RITs KSAEP, 2012 - 96 p.

Revisori: V. V. Kuzminova vicedirettore delle statistiche di Khabarovsk;

A. V. Piven, Ph.D. in Economics,

professore Associato presso il Dipartimento di Management, Finanza e Diritto

Il seminario del corso "Analisi e previsione delle serie storiche" è rivolto agli studenti della laurea triennale nel campo dell '"Economia". Il workshop contiene una panoramica dei concetti e dei metodi di analisi e previsione delle serie temporali, nonché esempi tipici con soluzioni e compiti per il materiale in esame. L'appendice contiene tabelle matematiche e statistiche.

Il workshop è rivolto a studenti della laurea triennale in direzione della formazione 080100.62 "Economia", nonché a professionisti.


© Accademia statale di economia e diritto di Khabarovsk, 2013


introduzione

Lo sviluppo del Paese pone in primo piano il compito di analisi e prospettive di sviluppo dei soggetti di relazione con il mercato ai vari livelli gerarchici di gestione al fine di selezionare scelte gestionali ottimali volte ad aumentare l'efficienza e l'attività aziendale del loro funzionamento.

Il tutorial "Analisi e previsione delle serie temporali" include una metodologia completa per la modellazione e la previsione delle informazioni dinamiche presentate da serie temporali di fenomeni e processi socioeconomici.

I fenomeni sociali non sono solo in connessione reciproca, ma anche in continuo movimento, cambiamento, sviluppo: questo è ciò che determina la necessità di previsione.

L'applicazione della metodologia di analisi e previsione basata su serie temporali considerate nel tutorial ha un valore applicato abbastanza ampio e può essere utilizzata per risolvere problemi specifici di studio di fenomeni e processi socio-economici reali come modellistica e previsione.

L'obiettivo finale della creazione di questo libro di testo è sviluppare negli specialisti una profonda conoscenza teorica della metodologia di analisi, modellazione e previsione di fenomeni e processi socio-economici, nonché abilità pratiche nell'analisi economica e statistica dello stato e modellazione di -Fenomeni e processi economici basati sulla costruzione di modelli adeguati e statistici che approssimano sufficientemente fenomeni e processi reali, sulla base dei quali è possibile sviluppare specifiche proposte, raccomandazioni e modalità del loro utilizzo applicato al macro e microlivello.


Fondamenti dell'applicazione della modellistica economica e statistica

Simulazione dinamica

Serie storica -è una sequenza di valori di una caratteristica nel tempo, in cui lo stato passato del fenomeno in esame influenza ogni valore successivo.

In una serie temporale, il tipo di relazione può essere determinato in base alle deviazioni dei valori empirici da quelli teorici ottenuti dall'equazione del trend. I componenti delle serie temporali hanno un effetto diverso sull'entità dei livelli della serie:

- se i fattori che costituiscono le componenti delle serie storiche hanno una relazione moltiplicativa, allora i valori dei livelli sono il prodotto di queste componenti:

- se i fattori sono correlati in modo additivo, i valori dei livelli delle serie temporali sono la somma delle componenti:

;

- se i fattori delle serie storiche sono espressi in combinazione, i valori dei livelli sono il prodotto o la somma delle componenti:

,

dove sono i livelli delle serie temporali;

- componente trend;

- componente stagionale;

- componente ciclica;

- componente casuale.

L'identificazione del principale trend di sviluppo è uno dei metodi per analizzare e generalizzare le serie temporali. Pertanto, si dovrebbe distinguere tra i concetti:

- la tendenza principale;

- la legge di sviluppo del fenomeno.

Trend - questa è una funzione analitica che descrive l'andamento generale dello sviluppo di un fenomeno basato su un solo fattore: il fattore tempo (t). Il trend non riproduce appieno la natura del trend di sviluppo e non può essere considerato come la legge di sviluppo del fenomeno.

La legge dello sviluppo del fenomeno - esprime l'essenza, la natura del fenomeno, che sfida la descrizione del trend.

Le serie temporali in cui è possibile stabilire l'andamento e la componente casuale possono essere espresse da un'equazione della forma

,

dove - una funzione del tempo, che descrive l'andamento delle serie temporali, è chiamata trend;

- variabile casuale (componente casuale).

La funzione determina l'andamento generale dello sviluppo del fenomeno in esame. Per costruire un modello e prevedere i fenomeni socio-economici è necessario testare l'ipotesi sulla presenza di un trend nelle serie storiche iniziali.

Modellazione delle tendenze

Si consiglia di iniziare ad analizzare e modellare l'andamento di una serie storica individuando la presenza di un trend. A tal fine, i metodi più efficaci sono il metodo Foster-Stewart, il test in serie, il test T cumulativo e il test della frequenza di fase dei segni delle differenze tra le deviazioni Wallis e Moore.

I principali approcci per identificare le tendenze si basano su test statistici di ipotesi sulla casualità di una serie.

Molto spesso, nella pratica dell'analisi delle serie temporali, vengono utilizzati i criteri per la verifica della "presenza-assenza" del trend: il metodo di Foster-Stewart e il criterio della serie basato sulla mediana campionaria.

L'ipotesi che ci sia una tendenza nel processo può essere verificata utilizzando foster - metodo Stewart... Questo metodo può essere implementato nei seguenti passaggi:

1. Ogni livello della serie viene confrontato con tutti i precedenti, determinando i valori delle caratteristiche ausiliarie e:

Quindi, se è maggiore di tutti i livelli precedenti, se è minore di tutti i livelli precedenti.

2. Calcolato per tutti.

Il valore può assumere valori 0; uno; -uno.

3. La caratteristica viene calcolata.

4. Con l'aiuto del test t di Student, viene verificata l'ipotesi che la differenza possa essere considerata casuale (ovvero, la serie può essere considerata casuale, non contenente un trend). Per questo, è determinato

dov'è l'errore quadratico medio del valore:

I valori sono tabulati (tabella 1).

Tabella 1 - Valori degli errori standard per n da 10 a 100

1,964 2,509 2,816
2,002 2,561 2,837
2,039 2,606 2,857
2,077 2,645 2,876
2,115 2,681 2,894
2,153 2,713
2,279 2,742
2,373 2,769
2,447 2,793

Il valore calcolato viene confrontato con il valore critico tratto dalla tabella di distribuzione dello studente. Se, allora, l'ipotesi dell'assenza di tendenza viene respinta.

Per esempio:La variazione del numero di nascite nel territorio di Khabarovsk è presentata nella Tabella 2:

Tabella 2 - Il numero di nascite nel territorio di Khabarovsk, persone

Controllare l'affermazione sull'assenza di una tendenza nella variazione del numero di nascite utilizzando il metodo Foster-Stewart. La probabilità di fiducia è 0,95.

Decisione

I calcoli ausiliari con il metodo Foster - Stewart sono presentati nella Tabella 3.

Tabella 3 - Calcoli ausiliari secondo il metodo Foster-Stewart

11 979 - - - 15 410
12 400 15 558
13 615 16 303
14 453 17 067
15 392 17 573
16 049 17 407

1. Se il livello è maggiore di tutti i livelli precedenti, inserisci 1 nella colonna, se è inferiore a tutti i livelli precedenti, inserisci 1 nella colonna.

2. Determina per.

4. Il valore per è preso dalla tabella 1.

Prendiamo il valore dalla tabella - Distribuzione dello studente:

.

Quindi l'ipotesi dell'assenza di tendenza viene respinta. Con una probabilità di 0,95, si verifica l'andamento delle serie temporali.

Criterio della serie, sulla base della mediana del campione, è implementato secondo il seguente algoritmo:

1. Dalla serie originale, una serie con intervallo (variazione) è formata dalla lunghezza :, dove è il valore più piccolo della serie.

2. Viene determinata la mediana di questa serie di variazioni. Se il valore è dispari, altrimenti

.

3. Una sequenza di pro e contro è formata secondo la seguente regola:

Se il valore è uguale alla mediana, questo valore viene ignorato.

4. Calcolato - il numero di serie nell'aggregato, dove una serie è intesa come una sequenza di più o meno successivi. Anche uno più o uno meno conterà come una serie. Determinato: la lunghezza della serie più lunga.

5. La verifica dell'ipotesi si basa sul fatto che, a condizione della casualità della serie, dovrebbero essere soddisfatte le seguenti disuguaglianze (per un livello di significatività del 5%)

Se almeno una delle disuguaglianze viene violata, l'ipotesi dell'assenza di una tendenza viene respinta.

Le parentesi quadre sul lato destro della disuguaglianza rappresentano il numero intero. La parte intera del numero A - [A] è il numero intero più vicino e non maggiore di A.

Per esempio:

d
Testiamo l'ipotesi che non ci sia tendenza nella variazione del numero di nascite (Tabella 2) utilizzando il test della serie basato sulla mediana campionaria. I calcoli ausiliari sono presentati nella Tabella 4.

Tabella 4 - Calcoli ausiliari per il criterio batch

11 979 11 979 - 15 410 15 558 -
12 400 12 400 - 15 558 16 049 +
13 615 13 615 - 16 303 16 303 +
14 453 14 453 - 17 067 17 067 +
15 392 15 392 - 17 573 17 573 +
16 049 15 410 + 17 407 17 407 +

1. Dalla serie originale, passare a quella classificata, disponendo i valori della serie originale in ordine crescente;

2. Poiché (pari), quindi, la mediana

3. Il valore di ogni livello della serie originale viene confrontato con il valore della mediana. Se, allora prende il valore "+", se minore, allora "-". Se il valore è uguale alla mediana, questo valore viene ignorato

4. - numero di serie;

- la lunghezza della serie più grande. Facciamo un controllo:

Entrambe le disuguaglianze sono soddisfatte, quindi, con una probabilità di 0,95, c'è un andamento nelle serie temporali, che è coerente con la conclusione fatta utilizzando il metodo Foster-Stewart.

T-test cumulativo consente di determinare la presenza non solo della tendenza stessa, ma anche della sua espressione matematica: la tendenza. Viene avanzata l'ipotesi principale () sull'assenza di un trend nelle serie storiche iniziali.

Il valore calcolato del criterio è determinato come il rapporto tra la somma accumulata dei quadrati delle deviazioni dei valori empirici dei livelli delle serie temporali dal loro valore medio () e le deviazioni stesse secondo la formula

dove è il totale accumulato delle deviazioni dei valori empirici dal livello medio della serie storica iniziale;

- la somma totale dei quadrati delle deviazioni, determinata dalla formula: .

Se viene analizzata una serie temporale sufficientemente lunga, la deviazione normalizzata può essere utilizzata per calcolare i valori del criterio:

.

I valori calcolati del test T cumulativo vengono confrontati con il tabulare ... Se, allora, l'ipotesi dell'assenza di tendenza viene respinta. Pertanto, nella serie storica originale, esiste una tendenza descritta dalla tendenza. Altrimenti, se, viene riconosciuta l'assenza di un trend in una serie di dinamiche.

Per esempio:Controlliamo l'ipotesi sull'assenza di una tendenza nel cambiamento del numero di organizzazioni edili operative nel territorio di Khabarovsk (tabella 5) del criterio T cumulativo.

Decisione

Tabella 5 - Calcoli ausiliari utilizzando il metodo del test T cumulativo

Anni Il numero di organizzazioni di costruzione attive,
1 845 654,5 428 370,3 654,5 428 370,3
1 740 549,5 301 950,3 1 204,0 1 449 616,0
1 543 352,5 124 256,2 1 556,5 2 422 692,0
1 573 382,5 146 306,3 1 939,0 3 759 721,0
1 097 -93,5 8 742,2 1 845,5 3 405 870,0
-237,5 56 406,3 1 608,0 2 585 664,0
-247,5 61 256,2 1 360,5 1 850 960,0
-207,5 43 056,3 1 153,0 1 329 409,0
-267,5 71 556,2 885,5 784 110,3
-313,5 98 282,2 572,0 327 184,0
-296,5 87 912,2 275,5 75 900,3
-275,5 75 900,3
Totale 14 286 - 1 503 995,0 - 18 419 498,0

1. Calcoliamo il valore medio e la varianza del numero di organizzazioni edili operative:

.

2. Determina il valore calcolato del criterio:

3. Calcoliamo i valori del criterio:

l'ipotesi dell'assenza di una tendenza è respinta, quindi, c'è una tendenza descritta dall'andamento della variazione del numero di organizzazioni di costruzione operative nel territorio di Khabarovsk.

Criterio della frequenza di fase per i segni delle differenze Wallis e Moore consente inoltre di determinare la presenza del trend principale nel suo complesso nelle serie storiche e appartiene al gruppo dei metodi non parametrici per la valutazione del trend.

Viene avanzata l'ipotesi principale () che i segni delle differenze tra loro formino una sequenza casuale. In questo caso, il concetto è formato fase come una sequenza di segni identici di differenze.

Se i segni nel determinare il numero di fasi (senza la prima e l'ultima) formano una sequenza casuale, il valore calcolato del criterio è determinato dalla formula

,

dov'è il criterio della differenza di frequenza di fase;

- il numero di livelli della riga, che è distribuita normalmente;

- numero di fasi.

Se il valore calcolato () del criterio supera il valore tabulare per un dato livello di significatività, viene rifiutata l'ipotesi che i segni delle differenze tra i livelli successivi delle serie temporali formino una sequenza casuale. Di conseguenza, i livelli delle serie temporali iniziali non formano una sequenza casuale, ma hanno un certo modello nel loro cambiamento e, quindi, c'è una tendenza nelle serie.

Per campioni di grandi dimensioni (), la correzione della continuità può essere omessa e la formula di calcolo sarà la seguente:

.

Se, quindi, la sequenza data è casuale.

Per esempio: Il cambiamento nel numero della popolazione economicamente attiva nel territorio di Khabarovsk è presentato nella Tabella 6:

Tabella 6 - Il numero di popolazione economicamente attiva nel territorio di Khabarovsk, migliaia di persone

Anno Popolazione economicamente attiva, migliaia di persone, Segni di deviazione Numerazione delle fasi
752,9
765,2 +
738,0 -
738,5 +
752,2 +
757,9 +
760,6 +
774,4 +
756,0 -
793,7 +
771,3 -
776,3 +

Controllare l'affermazione sull'assenza di una tendenza nella variazione delle dimensioni della popolazione economicamente attiva utilizzando il metodo del criterio della frequenza di fase dei segni delle differenze di Wallis e Moore. La probabilità di fiducia è 0,95.

Decisione

1. Trova i segni di deviazione e scrivi la numerazione delle fasi ().

2. Calcoliamo:

, quindi l'ipotesi nulla viene rifiutata. Di conseguenza, la dimensione della popolazione economicamente attiva non forma una sequenza casuale, ma ha un certo modello nel loro cambiamento e, quindi, c'è una tendenza nelle serie.

Decisione

1. Calcola il tasso di crescita medio

.

2. Definiamo la previsione con la formula

Compiti

Obiettivo 1. Vengono presentati i dati sul numero di ospedali nel territorio di Khabarovsk.

È necessario verificare la dichiarazione sull'assenza di una tendenza nel cambiamento del numero di ospedali nel territorio di Khabarovsk utilizzando il metodo Foster-Stewart. La probabilità di fiducia è 0,95.

Obiettivo 2.Secondo i dati disponibili sul numero di crimini registrati nel territorio di Khabarovsk, determinare la presenza della tendenza principale utilizzando il criterio della serie, con un livello di significatività

Obiettivo 3.Vengono presentati i dati sull'esportazione del commercio estero e dei servizi internazionali nel territorio di Khabarovsk.

Determinare la presenza del principale trend di sviluppo nelle serie studiate sulla base del criterio T cumulativo. La probabilità di fiducia è 0,95.

Attività 4.Secondo i dati disponibili sulle merci trasportate su strada nel territorio di Khabarovsk, determinare la presenza della tendenza principale utilizzando il criterio della frequenza di fase dei segni delle differenze Wallis e Moore. La probabilità di fiducia è 0,95.

Obiettivo 5.Secondo i dati disponibili sul consumo di uova e prodotti a base di uova nel territorio di Khabarovsk, costruire un grafico e calcolare le previsioni per il 2011-2013. basato sulla crescita media assoluta.

Compito 6. In base al numero medio annuo di persone impiegate nell'economia, costruisci un grafico e calcola le previsioni per il 2011-2013. con il metodo del tasso di crescita medio.

Domande di controllo e attività per la sezione I.

1. Descrivere il tipo di connessione in base ai componenti della serie storica in essa inclusa.

2. Formulare il concetto di "trend" e "trend". Mostra la differenza tra queste categorie.

3. Elencare i metodi per rilevare la presenza di una tendenza in una serie dinamica.

4. Formulare l'essenza del metodo Foster-Stewart.

5. Assegnare un nome alle fasi principali dell'implementazione del metodo di test T cumulativo.

6. Qual è l'essenza del metodo del criterio delle serie?

7. Formulare l'essenza del metodo del criterio fase-frequenza per i segni delle differenze Wallis e Moore.

8. Elencare i principali indicatori della dinamica dei fenomeni economici.

9. Qual è l'essenza della previsione basata sulla crescita media assoluta e sul tasso di crescita medio annuo?

Livellamento delle serie temporali

Decisione

Poiché il periodo di livellamento è difficile da giustificare, il calcolo inizia con una media mobile a 3 termini. Il primo livello livellato si ottiene per il 2000:

Spostando sequenzialmente l'inizio del periodo di scorrimento di un anno, troviamo livelli livellati per gli anni successivi. e trova la somma delle deviazioni

2 489 2 369,8 2 354,3 14 221,0 18 157,6 2 043 2 192,3 2 230,3 22 276,0 35 062,6 2 194 2 166,8 2 208,2 742,6 201,3 2 236 2 307,0 2 316,0 5 041,0 6 400,0 2 562 2 483,3 2 430,9 6 201,6 17 177,4 2 573 2 450,3 2 402,4 15 068,0 29 091,6 2 093 2 226,0 - 17 689,0 - 2 145 - - - - Totale 28 475 - - 93 197,5 107 468,9

Come puoi vedere dai calcoli, le medie mobili ponderate sono un po 'più vicine ai dati effettivi. Per loro, il quadrato della deviazione è inferiore a quello delle medie semplici: per la media mobile ponderata a tre termini \u003d 93,197,5 e per i cinque termini \u003d 107,468.

I calcoli mostrano che la media mobile a tre termini descrive meglio la regolarità del movimento dei livelli delle serie dinamiche.

- il valore del primo livello nell'area attiva;

- crescita media assoluta.

Inviare il tuo buon lavoro nella knowledge base è semplice. Utilizza il modulo sottostante

Studenti, dottorandi, giovani scienziati che utilizzano la base di conoscenza nei loro studi e nel loro lavoro te ne saranno molto grati.

postato su http://www.allbest.ru/

Metodi di previsione di base

Metodi di previsione sociale

Metodi di previsione finanziaria

Metodi di previsione economica

Metodi di previsione statistica

Metodi di previsione esperti

Analisi delle serie temporali

Componenti strutturali delle serie storiche

Metodi di previsione di base

La previsione è predire il futuro sulla base dell'esperienza accumulata e delle ipotesi attuali al riguardo.

La previsione è un processo complesso, durante il quale è necessario risolvere un gran numero di problemi diversi. Per la sua produzione, varie metodi di previsione, di cui oggi esiste un'enorme varietà, ma in pratica ne vengono utilizzati solo 15 - 20. Ci soffermeremo sui più popolari.

Il metodo delle valutazioni degli esperti. L'essenza di questo metodo è che la previsione si basa sull'opinione di uno specialista o di un gruppo di specialisti, che si basa sull'esperienza professionale, pratica e scientifica. Distinguere tra valutazioni di esperti collettive e individuali, spesso utilizzate nella valutazione del personale.

Metodo di estrapolazione. L'idea principale dell'estrapolazione è studiare le tendenze persistenti dello sviluppo aziendale che si sono sviluppate sia nel passato che nel presente e trasferirle nel futuro. Distinguere tra estrapolazione predittiva e formale. Formale - basato sul presupposto che le tendenze passate e presenti nello sviluppo dell'impresa rimarranno nel futuro; quando previsto, lo sviluppo attuale è associato a ipotesi sulla dinamica dell'impresa, tenendo conto del fatto che l'influenza di vari fattori su di essa cambierà in futuro. È necessario sapere che i metodi di estrapolazione vengono applicati al meglio nella fase iniziale della previsione al fine di identificare le tendenze negli indicatori.

Metodi di modellazione. La modellazione è la costruzione di un modello sulla base di uno studio preliminare di un oggetto e dei processi, la selezione delle sue caratteristiche e caratteristiche essenziali. La previsione mediante modelli include il suo sviluppo, l'analisi sperimentale, il confronto dei risultati dei calcoli preliminari di previsione con i dati effettivi sullo stato del processo o dell'oggetto, l'affinamento e la correzione del modello.

Il metodo di previsione economica (analisi economica) consiste nel fatto che qualsiasi processo o fenomeno economico in atto nell'impresa è suddiviso in parti, dopodiché l'influenza e l'interconnessione di queste parti sull'andamento e lo sviluppo del processo, nonché l'uno sull'altro, si rivela. Con l'aiuto dell'analisi, è possibile rivelare l'essenza di tale processo, nonché determinare i modelli del suo cambiamento in futuro, per valutare in modo completo i modi per raggiungere gli obiettivi prefissati. Poiché l'analisi economica è parte integrante e uno degli elementi della logica di previsione, dovrebbe essere condotta a livello macro, meso e micro. Utilizzato quando si pianifica la produzione in un'impresa. esperto di previsione del tempo economico

Il processo di analisi economica può essere suddiviso in più fasi:

* enunciazione del problema, definizione dei criteri di valutazione e degli obiettivi;

* preparazione delle informazioni necessarie per l'analisi;

* elaborazione analitica delle informazioni dopo il suo studio;

* presentazione dei risultati.

Metodo dell'equilibrio. Questo metodo si basa sullo sviluppo dei saldi, che sono un sistema di indicatori, dove la prima parte, che caratterizza le risorse in base alla loro fonte di ricezione, è uguale alla seconda, riflettendo la loro distribuzione in tutte le direzioni di consumo.

Il metodo del saldo implementa il principio di proporzionalità ed equilibrio, utilizzato nello sviluppo delle previsioni. La sua essenza sta nel collegare le esigenze di un'impresa in vari tipi di materie prime, risorse materiali, finanziarie e di lavoro con le possibilità di produrre un prodotto e le fonti di risorse. Pertanto, il sistema di saldi utilizzato nelle previsioni include: saldi finanziari, materiali e saldi del lavoro. Ciascuno di questi gruppi include anche una serie di saldi.

Metodo normativo - uno dei principali metodi di previsione. Al momento si è cominciato ad attribuirgli una grande importanza. La sua essenza risiede negli studi di fattibilità delle previsioni utilizzando standard e norme. Questi ultimi vengono utilizzati per calcolare il fabbisogno di risorse, nonché indicatori del loro utilizzo.

Metodo con target programmato (PCM). Rispetto ad altri metodi, questo metodo è relativamente nuovo e non sufficientemente sviluppato. Ha iniziato ad essere ampiamente utilizzato solo negli ultimi anni. Il PCM è strettamente correlato ai metodi già considerati e prevede lo sviluppo di una previsione a partire dalla valutazione dei bisogni finali sulla base degli obiettivi di sviluppo dell'impresa nell'ulteriore individuazione e ricerca di mezzi e modi efficaci per raggiungerli, nonché fornitura di risorse.

L'essenza del PMC è determinare gli obiettivi principali dello sviluppo dell'impresa, sviluppare misure correlate per raggiungerli entro un lasso di tempo predeterminato con una fornitura equilibrata di risorse, nonché tenendo conto del loro uso efficace.

Oltre alla previsione, PMC viene utilizzato nella creazione di programmi target complessi, che sono un documento che riflette l'obiettivo e il complesso di attività e compiti di produzione, organizzativi, economici, sociali e di altro tipo, collegati da esecutori, tempi di attuazione e risorse.

Metodi di previsione sociale

La previsione sociale come studio con un'ampia copertura degli oggetti di analisi si basa su molti metodi. Nella classificazione dei metodi di previsione vengono evidenziate le loro caratteristiche principali, che consentono di strutturarle in base a: grado di formalizzazione; il principio di azione; metodo per ottenere informazioni.

Il grado di formalizzazione nei metodi di previsione può variare a seconda dell'oggetto della ricerca; i metodi per ottenere informazioni predittive sono multivalore, dovrebbero includere: metodi di modellazione associativa, analisi morfologica, modellazione probabilistica, domande, metodo di intervista, metodi di generazione di idee collettive, metodi di analisi storica e logica, scrittura di copioni, ecc. I metodi più comuni di previsione sociale sono i metodi di estrapolazione, modellazione ed esame.

Per estrapolazione si intende l'estensione delle conclusioni riguardanti una parte di un fenomeno ad un'altra parte, al fenomeno nel suo insieme, al futuro. L'estrapolazione si basa sull'ipotesi che i modelli precedentemente identificati opereranno nel periodo di previsione. Ad esempio, una conclusione sul livello di sviluppo di qualsiasi gruppo sociale può essere tratta dalle osservazioni dei suoi rappresentanti individuali e sulle prospettive della cultura - dalle tendenze passate.

Il metodo di estrapolazione è diverso: ci sono almeno cinque diverse opzioni. L'estrapolazione statistica - proiezione della crescita della popolazione basata su dati passati - è uno dei metodi più importanti delle moderne previsioni sociali.

La modellazione è un metodo per studiare gli oggetti della conoscenza sulle loro controparti: materiali o mentali.

Un analogo di un oggetto può essere, ad esempio, il suo layout, disegno, diagramma, ecc. Nella sfera sociale, i modelli mentali sono più comunemente usati. Lavorare con i modelli permette di trasferire la sperimentazione da un vero oggetto sociale al suo duplicato costruito mentalmente e di evitare il rischio di una decisione manageriale non riuscita, tanto più pericolosa per le persone. La caratteristica principale di un modello mentale è che può essere sottoposto a qualsiasi tipo di test, che in pratica consistono nel fatto che cambiano i parametri di esso e l'ambiente in cui esiste (come un analogo di un oggetto reale). Questo è il grande vantaggio del modello. Può anche fungere da modello, una sorta di tipo ideale, la cui approssimazione può essere desiderabile per i creatori del progetto.

Il metodo di previsione più praticato è il giudizio di esperti. Secondo EI Kholostova, “l'esame è uno studio di un problema difficile da formalizzare, che si realizza formando un'opinione (preparando un'opinione) di uno specialista che sia in grado di sopperire alla mancanza o inconsistenza delle informazioni sul tema oggetto di studio con la sua conoscenza, intuizione, esperienza nel risolvere problemi simili e affidandosi al “buon senso”.

Ci sono ambiti della vita sociale in cui è impossibile utilizzarne altri metodi di previsione, tranne esperto. Prima di tutto, questo vale per quelle aree in cui non ci sono informazioni necessarie e sufficienti sul passato.

Quando una valutazione da parte di esperti dello stato di una sfera sociale separata, o del suo elemento costitutivo, o dei suoi componenti, viene presa in considerazione una serie di disposizioni obbligatorie e requisiti metodologici.

Prima di tutto - una valutazione della situazione iniziale:

Fattori che predeterminano la condizione insoddisfacente;

Direzioni, tendenze, più tipiche per il dato stato della situazione;

Caratteristiche, specifiche dello sviluppo dei componenti più importanti;

Le forme di lavoro più caratteristiche, i mezzi con cui viene svolta l'attività.

Il secondo blocco di domande include un'analisi delle attività di quelle organizzazioni e servizi che svolgono questa attività. La loro performance viene valutata identificando le tendenze nel loro sviluppo, il loro posizionamento nell'opinione pubblica.

La valutazione degli esperti è effettuata da centri speciali di competenza, centri di informazione scientifica e di analisi, laboratori di esperti, gruppi di esperti e singoli esperti.

La metodologia di lavoro degli esperti comprende una serie di fasi:

La cerchia degli esperti è determinata;

I problemi vengono identificati;

Vengono delineati un piano e un tempo di azione;

Sono in corso di elaborazione criteri per le valutazioni degli esperti;

Sono indicate le forme e le modalità con le quali verranno espressi i risultati dell'esame (nota analitica, "tavola rotonda", convegno, pubblicazioni, interventi di esperti).

Quindi, la previsione sociale si basa su vari metodi di ricerca, i principali dei quali sono l'estrapolazione, la modellizzazione e l'esame.

Metodi di previsione finanziaria

Previsioni finanziarie utilizzando il metodo del budget

Il processo di budgeting è parte integrante della pianificazione finanziaria, il processo di determinazione delle azioni future per la formazione e l'utilizzo delle risorse finanziarie.

Il budget è il processo di creazione ed esecuzione di un budget aziendale basato sui budget dei singoli reparti.

Budget: un piano dettagliato delle attività dell'azienda per il periodo successivo, che copre i ricavi delle vendite, la produzione e le spese finanziarie, il flusso di cassa, la formazione del profitto dell'azienda.

I budget si dividono in due tipologie principali:

Budget operativo, che riflette le attività (di produzione) correnti dell'impresa;

Budget finanziario, che è una previsione del bilancio.

Il piano profitti e perdite è il documento principale del budget operativo. Contiene dati sull'ammontare e sulla struttura dei proventi delle vendite, sul costo delle merci vendute e sui risultati finanziari finali.

Il budget finanziario è predisposto tenendo conto delle informazioni contenute nel conto economico.

Una delle fasi principali del budget è la previsione dei flussi di cassa.

Un budget di flusso di cassa è un piano per incassi e pagamenti. Quando si calcola il budget del flusso di cassa, è di fondamentale importanza determinare l'ora di incassi e pagamenti e non l'ora di esecuzione delle transazioni commerciali.

Il valore del budget totale per l'impresa si rivela attraverso le seguenti funzioni:

Pianificazione delle operazioni per garantire il raggiungimento degli obiettivi dell'impresa;

Coordinamento delle varie tipologie di attività e dei singoli reparti. Coordinamento degli interessi dei singoli dipendenti e dei gruppi nel loro complesso nell'impresa;

Incoraggiare i leader di tutti i ranghi a raggiungere gli obiettivi dei loro centri di responsabilità;

Monitoraggio delle attività in corso, garantendo la disciplina pianificata;

La base per valutare l'attuazione del piano da parte dei centri di responsabilità e dei loro leader;

Strumento di formazione per manager.

A differenza dei conti economici o dei bilanci formalizzati, il budget non ha una forma standardizzata che deve essere seguita rigorosamente. Il budget può avere un numero infinito di tipologie e forme. La forma e la struttura del budget dipendono da molti fattori: le dimensioni dell'impresa; sufficienza e disponibilità delle informazioni iniziali; lo stato del quadro normativo dell'impresa; dalle qualifiche e dall'esperienza dello sviluppatore.

Previsione finanziaria utilizzando la percentuale delle vendite

Esistono due metodi principali di previsione finanziaria. Uno di questi, il metodo di budgeting, è presentato nella sezione 3 delle linee guida. Ricordiamo che si basa sul concetto di flussi di cassa ed è analogo al calcolo della parte finanziaria di un business plan.

Il secondo metodo è chiamato metodo "percentuale delle vendite" (prima modifica) o metodo "formula" (seconda modifica). I suoi vantaggi sono semplicità e brevità. Viene utilizzato per calcoli approssimativi della necessità di finanziamenti esterni.

Fattori che influenzano l'entità della necessità di finanziamenti aggiuntivi:

Tasso di crescita previsto del volume delle vendite;

Livello di base di utilizzo delle immobilizzazioni;

Intensità di capitale (intensità di risorse) dei prodotti;

Redditività del prodotto;

Politica dei dividendi.

Il metodo della "percentuale delle vendite" è un metodo di dipendenza proporzionale degli indicatori di prestazione di un'impresa dal volume delle vendite.

Tutti i calcoli che utilizzano il metodo "percentuale delle vendite" (il metodo "formula") si basano sui seguenti presupposti:

1. Costi variabili, attività correnti e passività correnti con vendite in aumento di un certo numero di percentuali aumentano, in media, della stessa percentuale. Ciò significa che sia le attività correnti che le passività correnti rappresenteranno la stessa percentuale di entrate nel periodo di pianificazione;

2. La percentuale di aumento del valore delle immobilizzazioni è calcolata in una data percentuale dell'incremento del fatturato secondo:

a) le condizioni tecnologiche dell'attività;

b) tenendo conto della presenza di immobilizzazioni sottoutilizzate all'inizio del periodo di previsione;

c) in base al grado di deprezzamento materiale e morale delle immobilizzazioni in contanti, ecc.;

3. Le passività a lungo termine e il capitale proprio sono considerati invariati nella previsione;

4. Le proiezioni degli utili portati a nuovo tengono conto del tasso di distribuzione dell'utile netto per i dividendi e della redditività netta dei prodotti venduti.

Per prevedere gli utili non distribuiti, l'utile netto previsto viene aggiunto agli utili non distribuiti del periodo di base e i dividendi vengono sottratti.

Metodi di previsione economica

Un posto speciale nella classificazione dei metodi di previsione economica è occupato dai cosiddetti metodi combinati, che combinano vari altri metodi. Ad esempio, revisione tra pari collettiva e tecniche di modellazione o sondaggi statistici e di esperti.

Le informazioni fattuali e di esperti vengono utilizzate come informazioni.

Quando si classificano i metodi di previsione, è necessario tenere presente che la sistematizzazione significativa dei metodi di previsione dovrebbe essere determinata dall'oggetto di previsione stesso, dai processi di sviluppo economico e dalle loro leggi.

Dal punto di vista della valutazione dei possibili risultati e delle modalità di sviluppo scientifico e tecnologico predittivo, le previsioni possono essere classificate in tre fasi: ricerca, programma e organizzazione.

Il compito della previsione della ricerca è determinare i possibili risultati dello sviluppo futuro e selezionare uno o più risultati positivi da una varietà di possibili opzioni. Quindi, ad esempio, lo sviluppo della tecnologia informatica può riflettersi nella crescita delle loro prestazioni, un aumento della quantità di memoria e della gamma di possibilità logiche.

L'obiettivo principale di questa fase è rivelare un'ampia gamma di prospettive fondamentalmente possibili sotto forma di uno o più problemi scientifici e tecnici da risolvere durante il periodo di previsione.

L'aspetto programmatico della previsione è determinare le possibili modalità per ottenere i risultati desiderati e necessari; previsto in termini di tempo di attuazione di ciascuna delle possibili opzioni e grado di affidabilità nel raggiungimento di un risultato positivo per un'opzione o per un'altra.

L'aspetto organizzativo della previsione include una serie di misure organizzative e tecniche che garantiscono il raggiungimento di un determinato risultato per l'una o l'altra opzione. Sotto l'aspetto organizzativo, procedono dal concetto di risorse economiche disponibili e potenziale scientifico accumulato. Qui dovrebbe essere formulata un'ipotesi ben fondata dello sviluppo di un complesso di parametri organizzativi della scienza, dovrebbe essere fornita una valutazione probabilistica dello schema di allocazione delle risorse raccomandato e delle prospettive di crescita del potenziale scientifico per il periodo di previsione.

Le fasi considerate dello sviluppo scientifico e tecnologico, di regola, sono complesse e sono interconnesse.

Metodi di previsione statistica

Statistico metodi di previsione coprire lo sviluppo, lo studio e l'applicazione di metodi di previsione matematica e statistica moderni basati su dati oggettivi (inclusi metodi dei minimi quadrati non parametrici con valutazione dell'accuratezza della previsione, metodi adattivi, metodi autoregressivi e altri); sviluppo della teoria e pratica della modellizzazione probabilistica e statistica di metodi di previsione degli esperti, inclusi metodi di analisi delle valutazioni di esperti soggettive basate su statistiche di dati non numerici; sviluppo, studio e applicazione di metodi di previsione in condizioni di rischio e metodi di previsione combinati utilizzando modelli congiuntamente economico-matematici ed econometrici (sia matematico-statistici che esperti). La base scientifica dei metodi di previsione statistica è la statistica applicata e la teoria delle decisioni. I metodi più semplici per ripristinare le dipendenze utilizzati per la previsione si basano su una data serie temporale, ovvero una funzione definita in un numero finito di punti sull'asse del tempo. In questo caso, le serie temporali sono spesso considerate nell'ambito di uno o un altro modello probabilistico, vengono introdotti altri fattori (variabili indipendenti) oltre al tempo, ad esempio il volume dell'offerta di moneta. Le serie temporali possono essere multidimensionali. I compiti principali da risolvere sono l'interpolazione e l'estrapolazione.

Il metodo dei minimi quadrati nel caso più semplice (una funzione lineare di un fattore) è stato sviluppato da K. Gauss nel 1794-1795. La pre-trasformazione delle variabili, come la presa dei logaritmi, può essere utile. Il metodo dei minimi quadrati più comunemente utilizzato con diversi fattori.

Il modulo minimo, le spline e altri metodi di estrapolazione sono usati meno comunemente, sebbene le loro proprietà statistiche siano spesso migliori. È stata accumulata esperienza nella previsione dell'indice di inflazione e del costo del paniere dei consumatori. Si è rivelato utile trasformare (prendere logaritmi) della variabile: l'attuale indice di inflazione. La stima dell'accuratezza delle previsioni (in particolare, utilizzando gli intervalli di confidenza) è una parte necessaria della procedura di previsione. Di solito vengono utilizzati modelli probabilistico-statistici di recupero dalla dipendenza, ad esempio, costruiscono la migliore previsione utilizzando il metodo della massima verosimiglianza. Sono state sviluppate stime parametriche (generalmente basate su un modello di errori normali) e non parametriche dell'accuratezza della previsione e dei relativi limiti di confidenza (basati sul Teorema del limite centrale della teoria della probabilità). Pertanto, vengono proposti metodi non parametrici di stima riservata del punto di sovrapposizione (incontro) di due serie temporali per valutare le dinamiche del livello tecnico dei propri prodotti e dei prodotti dei concorrenti presentati sul mercato mondiale. Vengono utilizzate anche tecniche euristiche che non si basano sulla teoria statistica probabilistica: il metodo delle medie mobili, il metodo dello smoothing esponenziale.

La regressione multivariata, compreso l'uso di stime non parametriche della densità di distribuzione, è il principale strumento statistico per la previsione oggi. Sottolineiamo che non è necessario utilizzare l'ipotesi irrealistica sulla normalità degli errori di misurazione e delle deviazioni dalla linea di regressione (superficie). Tuttavia, per abbandonare l'assunto di normalità, è necessario fare affidamento su un diverso apparato matematico basato sul Teorema del limite centrale multidimensionale della teoria della probabilità, la tecnologia della linearizzazione e dell'ereditarietà della convergenza. Consente di eseguire la stima puntuale e dell'intervallo dei parametri, controllare la significatività della loro differenza da zero in un ambiente non parametrico e costruire limiti di confidenza per la previsione. Molto importante è il problema della verifica dell'adeguatezza del modello, così come il problema della selezione dei fattori. L'elenco a priori dei fattori che influenzano la risposta è solitamente piuttosto ampio. È auspicabile accorciarlo e un'area separata della ricerca moderna è dedicata ai metodi di selezione del "set informativo di caratteristiche". Tuttavia, questo problema non è stato ancora risolto definitivamente. Compaiono effetti insoliti. Pertanto, è stato stabilito che le stime comunemente utilizzate del grado di un polinomio hanno una distribuzione geometrica negli asintotici. I metodi non parametrici per la stima della densità di probabilità e la loro applicazione per ripristinare una dipendenza dalla regressione di tipo arbitrario sono promettenti. I risultati più generali in quest'area si ottengono utilizzando approcci di statistica dei dati non numerici. I moderni metodi di previsione statistica includono anche modelli di autoregressione, il modello Box Jenkins, sistemi di equazioni econometriche basati su approcci parametrici e non parametrici. Per stabilire la possibilità di applicare risultati asintotici per campioni di dimensioni finite (cosiddette "piccole"), sono utili le tecnologie statistiche del computer. Consentono inoltre di costruire vari modelli di simulazione. Notare l'utilità dei metodi di propagazione dei dati (metodi bootstrap). I sistemi di previsione ad alta intensità di computer combinano vari metodi di previsione in un'unica stazione di lavoro automatizzata di previsione.

La previsione basata su dati non numerici, ad esempio, la previsione delle caratteristiche qualitative si basa su statistiche da dati non numerici. L'analisi di regressione basata su dati di intervallo, tra cui, in particolare, la determinazione e il calcolo di una dimensione del campione razionale, nonché l'analisi di regressione di dati fuzzy, sembra essere molto promettente per la previsione. La formulazione generale dell'analisi di regressione nel quadro delle statistiche di dati non numerici e dei suoi casi speciali - analisi della varianza e analisi discriminante (riconoscimento di modelli con un insegnante), - che fornisce un approccio unificato a metodi formalmente differenti, sono utili nel software implementazione di moderni metodi di previsione statistica. Le principali procedure per l'elaborazione delle valutazioni predittive degli esperti sono il controllo della coerenza, l'analisi dei cluster e la ricerca di opinioni di gruppo.

La verifica della coerenza delle opinioni degli esperti espresse dalle classifiche viene effettuata utilizzando i coefficienti di correlazione dei ranghi di Kendall e Spearman, il coefficiente di concordanza dei ranghi di Kendall e Smith. Vengono utilizzati modelli parametrici di confronti appaiati - Thurstone, Bradley - TerryLews - e modelli non parametrici della teoria di Lucians. Una procedura utile è riconciliare le classifiche e le classificazioni costruendo relazioni binarie corrispondenti. In assenza di coerenza, la divisione delle opinioni degli esperti in gruppi di simili viene effettuata con il metodo del vicino più prossimo o altri metodi di analisi dei cluster (costruzione automatica di classificazioni, riconoscimento di modelli senza insegnante). I luciani sono classificati in base a un modello statistico probabilistico. Vari metodi sono utilizzati anche per costruire l'opinione finale della commissione di esperti. I metodi della media aritmetica e dei ranghi mediani si distinguono per la loro semplicità. La modellazione al computer ha permesso di stabilire una serie di proprietà della mediana di Kemeny, che è spesso raccomandata per l'uso come opinione finale (generalizzata, media) di una commissione di esperti nel caso in cui le loro stime siano fornite sotto forma di una classifica .

L'interpretazione della legge dei grandi numeri per i dati non numerici in termini di teoria dell'indagine di esperti è la seguente: l'opinione finale è stabile, ad es. cambia poco quando cambia la composizione del comitato di esperti, e quando il numero di esperti cresce, si avvicina alla "verità". Si presume che le risposte degli esperti possano essere considerate come i risultati di misurazioni con errori, tutti sono elementi casuali indipendenti equamente distribuiti, la probabilità di accettare un certo valore diminuisce con la distanza da un certo centro - "verità", e la il numero totale di esperti è abbastanza grande. In specifici compiti di previsione, è necessario classificare i rischi, impostare il compito di valutare un rischio specifico, strutturare il rischio, in particolare, costruire alberi delle cause (in un'altra terminologia, alberi dei guasti) e alberi delle conseguenze (alberi degli eventi).

Il compito centrale è costruire indicatori di gruppo e generalizzati, ad esempio indicatori di competitività e qualità. I rischi devono essere presi in considerazione quando si prevedono le conseguenze economiche delle decisioni prese, il comportamento dei consumatori e l'ambiente competitivo, le condizioni economiche esterne e lo sviluppo macroeconomico della Russia, lo stato ecologico dell'ambiente, la sicurezza delle tecnologie, il rischio ambientale dei prodotti industriali e altro. strutture. Le moderne tecnologie di previsione al computer si basano su statistiche interattive metodi di previsione e l'uso di basi di dati econometriche, simulazione (anche basata sull'uso del metodo del test statistico) e modelli dinamici economici e matematici, che combinano blocchi esperti, matematici e statistici e di modellazione.

Metodi di previsione esperti

Esperto: uno specialista qualificato coinvolto nella formazione di stime relative all'oggetto di previsione. Gruppo di esperti: un team di esperti formato secondo determinate regole. Il giudizio di un esperto o di un gruppo di esperti riguardo al compito di previsione è chiamato giudizio esperto; nel primo caso viene utilizzato il termine "valutazione (previsione) di un esperto individuale" e nel secondo - "valutazione (previsione) di un esperto collettivo". La capacità di un esperto di creare, sulla base di conoscenze professionali, intuizione ed esperienza, stime affidabili dell'oggetto di previsione caratterizza la sua competenza. Quest'ultimo ha una misura quantitativa chiamata coefficiente di competenza. Lo stesso vale per il gruppo di esperti: competenza del gruppo di esperti è la sua capacità di creare stime affidabili dell'oggetto di previsione, adeguate all'opinione della popolazione generale di esperti; una misura quantitativa della competenza di un gruppo di esperti è determinata sulla base della generalizzazione dei coefficienti di competenza dei singoli esperti inclusi nel gruppo.

Metodo di previsione degli esperti: un metodo di previsione basato sulle informazioni degli esperti. Sotto l'aspetto teorico, la legittimità dell'utilizzo del metodo esperto è confermata dal fatto che i giudizi degli esperti ottenuti metodologicamente correttamente soddisfano due criteri generalmente accettati per l'affidabilità di qualsiasi nuova conoscenza scientifica: l'accuratezza e la riproducibilità del risultato. La tabella riporta i nomi e le brevi caratteristiche dei principali metodi esperti utilizzati nello sviluppo delle previsioni socio-economiche.

Analisi delle serie temporali

Obiettivi, metodi e fasi dell'analisi delle serie temporali

Lo studio pratico di una serie temporale implica l'identificazione delle proprietà della serie e l'ottenimento di conclusioni sul meccanismo probabilistico che genera questa serie. Gli obiettivi principali quando si studia una serie temporale sono i seguenti:

Descrizione delle caratteristiche della serie in una forma sintetica;

Costruire un modello di serie temporale;

Previsione dei valori futuri sulla base di osservazioni passate;

Gestire il processo che genera una serie temporale campionando segnali che avvertono di imminenti eventi avversi.

Il raggiungimento degli obiettivi prefissati non è sempre possibile, sia a causa della mancanza di dati iniziali (durata di osservazione insufficiente), sia a causa della variabilità della struttura statistica delle serie nel tempo.

Gli obiettivi elencati determinano in larga misura la sequenza delle fasi dell'analisi delle serie temporali:

rappresentazione grafica e descrizione del comportamento delle righe;

selezione ed esclusione di componenti naturali e non casuali della serie, a seconda del tempo;

studio della componente aleatoria delle serie storiche, rimasta dopo l'eliminazione della componente regolare;

costruzione (selezione) di un modello matematico per descrivere la componente casuale e verificarne l'adeguatezza;

prevedere i valori futuri della serie.

Nell'analisi delle serie temporali vengono utilizzati vari metodi, i più comuni dei quali sono:

analisi di correlazione, utilizzata per identificare i tratti caratteristici di una serie (periodicità, trend, ecc.);

analisi spettrale, che permette di trovare le componenti periodiche delle serie storiche;

tecniche di smoothing e filtraggio progettate per trasformare le serie temporali per rimuovere le fluttuazioni stagionali e di alta frequenza;

metodi di previsione.

Componenti strutturali delle serie storiche

Come già notato, è consuetudine distinguere due componenti principali in un modello di serie temporale: deterministica e casuale (Fig. 1). La componente deterministica delle serie storiche è intesa come una sequenza numerica, i cui elementi sono calcolati secondo una certa regola in funzione del tempo t. Eliminando la componente deterministica dai dati, otteniamo una serie oscillante intorno allo zero, che in un caso limite può rappresentare salti puramente casuali, e nell'altro un movimento oscillatorio regolare. Nella maggior parte dei casi, ci sarà qualcosa nel mezzo: qualche irregolarità e un certo effetto sistematico dovuto alla dipendenza dei membri successivi della serie.

A sua volta, la componente deterministica può contenere i seguenti componenti strutturali:

Trend g, che è un cambiamento graduale nel processo nel tempo ed è dovuto all'azione di fattori a lungo termine. Come esempio di tali fattori nell'economia, si possono citare: a) cambiamenti nelle caratteristiche demografiche della popolazione (dimensioni, struttura per età); b) sviluppo tecnologico ed economico; c) crescita dei consumi.

L'effetto stagionale è associato alla presenza di fattori che agiscono ciclicamente con una periodicità predeterminata. La serie in questo caso ha una scala temporale gerarchica (ad esempio, entro un anno ci sono stagioni associate a stagioni, trimestri, mesi) ed effetti simili si verificano in punti con lo stesso nome.

Pubblicato su Allbest.ru

...

Documenti simili

    L'essenza della previsione economica, caratteristiche delle principali forme di previsione. Prevedere le condizioni interne ed esterne dell'attività. Tipi di previsioni e tecnologia di previsione. Metodi di previsione: esperto, statistico, combinato.

    term paper, aggiunto il 22/12/2009

    Studio dei metodi di previsione dello sviluppo: estrapolazione, bilancio, metodo normativo e programma-obiettivo. Studio dell'organizzazione del lavoro dell'esperto, formazione di questionari e tabelle di stima degli esperti. Analisi di modelli di previsione matematici e statistici.

    test, aggiunto il 19/06/2011

    Il concetto, le funzioni ei metodi di previsione: un giudizio scientificamente fondato sui possibili stati di un oggetto nel futuro, sui modi alternativi e sui tempi del loro raggiungimento. Classificazione dei metodi di previsione: sociosinergetica, "generazione di idee collettive".

    term paper, aggiunto il 03/10/2011

    L'essenza dei concetti di base nel campo della previsione. Segni di classificazione, tipi di previsioni e loro caratteristiche. Approcci estrapolativi e alternativi. Metodi statistici ed esperti, loro varietà. Contenuto e fasi di sviluppo di un piano di vendita.

    abstract, aggiunto il 25/01/2010

    L'essenza e la struttura del sistema di previsione socioeconomica, i tipi di previsioni e la possibilità della loro applicazione per l'impresa. Misure per pianificare le attività dell'impresa, i loro livelli e finalità. Metodi esperti, modalità di previsione.

    abstract, aggiunto il 27/06/2010

    L'essenza della previsione come metodo di previsione a lungo termine. Metodi di previsione utilizzati nella previsione. Tecnologie critiche, panel di esperti. Caratteristiche della lungimiranza aziendale. Applicazione del metodo delle "road map" tecnologiche aziendali.

    term paper, aggiunto il 26/11/2014

    Conoscenza dei principali problemi di previsione, soluzioni. Livellamento dei modelli di previsione. Analisi degli approcci all'intelligenza artificiale: analogia biologica, architettura di rete, metodi ibridi. I lavori del programma per la previsione delle reti neurali.

    tesi, aggiunta il 27/06/2012

    Metodi di previsione utilizzati nella gestione dell'innovazione. Scale e metodi di misurazione nella valutazione degli esperti. Organizzazione e conduzione delle competenze. Ottenere una valutazione generalizzata basata su valutazioni di esperti individuali, coerenza dei pareri.

    term paper, aggiunto il 05/07/2013

    term paper, aggiunto il 24/12/2011

    Concetti di previsione e pianificazione. Perché è difficile prevedere. Vari tipi di incertezze. Criteri di classificazione della pianificazione. Tecniche di base e tipi di pianificazione. Metodi di previsione di base. Pianificazione come decisione di gestione.

07.10.2013 Tyler Chessman

La comprensione delle idee chiave della previsione delle serie temporali e la familiarità con alcuni dettagli forniranno un vantaggio nell'utilizzo delle funzionalità di previsione di SQL Server Analysis Services (SSAS)

Questo articolo descriverà i concetti di base richiesti per padroneggiare le tecnologie di data mining. Tratteremo anche alcune sottigliezze in modo da non scoraggiarti quando le affronti nella pratica (vedi la barra laterale "Perché il data mining è così impopolare").

Di tanto in tanto, i professionisti di SQL Server devono fare proiezioni di valore futuro, come proiezioni di entrate o vendite. Le organizzazioni a volte utilizzano la tecnologia di data mining nella creazione di modelli predittivi per fornire tali stime. Dopo aver compreso i concetti di base e alcuni dettagli, è possibile iniziare a utilizzare con successo le funzionalità predittive di SQL Server Analysis Services (SSAS).

Metodi di previsione

Esistono vari approcci alla previsione. Ad esempio, il sito web dei metodi di previsione (forecastingmethods.org) distingue tra diverse categorie di metodi di previsione, tra cui casual (altrimenti chiamato economico e matematico), modellazione esperta (soggettiva), serie temporali, intelligenza artificiale, mercato previsionale, previsione probabilistica, modellazione previsionale e previsione del metodo basata su classi di riferimento. Il sito web dei Principi di previsione (www.forecastingprinciples.com) fornisce una visualizzazione ad albero dei metodi, separando principalmente metodi soggettivi (ovvero metodi utilizzati quando non sono disponibili dati sufficienti per l'analisi quantitativa) e statici (ovvero metodi utilizzati quando sono disponibili i dati numerici corrispondenti) . In questo articolo, mi concentrerò sulla previsione delle serie temporali, un tipo di approccio statico in cui i dati accumulati sono sufficienti per prevedere gli indicatori.

La previsione delle serie temporali presuppone che i dati del passato aiutino a spiegare i valori futuri. È importante capire che in alcuni casi abbiamo a che fare con dettagli che non si riflettono nei dati accumulati. Ad esempio, emergerà un nuovo concorrente che potrebbe influenzare negativamente i guadagni futuri o rapidi cambiamenti nella forza lavoro che potrebbero influenzare i tassi di disoccupazione. In situazioni come questa, la previsione delle serie temporali potrebbe non essere l'unico approccio. Spesso, diversi approcci di previsione vengono combinati per fornire le previsioni più accurate.

Comprensione delle basi della previsione delle serie temporali

Una serie temporale è una raccolta di valori ottenuti in un periodo di tempo, generalmente a intervalli regolari. Esempi comuni includono vendite settimanali, spese trimestrali e tassi di disoccupazione mensili. I dati delle serie temporali sono presentati in un formato grafico, con intervalli di tempo lungo l'asse x del grafico e valori lungo l'asse y, come mostra la Figura 1.

Quando si considera come un valore cambia da un periodo all'altro e come prevedere i valori, è necessario tenere presente che i dati delle serie temporali hanno alcune caratteristiche importanti.

  • Livello base. La linea di base è generalmente definita come la media di una serie temporale. In alcuni modelli di previsione, la linea di base è generalmente definita come il valore iniziale dei dati della serie.
  • Tendenza La tendenza di solito mostra come le serie temporali cambiano da un periodo all'altro. Nell'esempio mostrato nella Figura 1, il numero di disoccupati ha una tendenza al rialzo dall'inizio del 2008 a gennaio 2010, dopodiché la linea di tendenza scende. Per informazioni sulla serie di dati campione utilizzati per tracciare i grafici in questo articolo, vedere la barra laterale "Calcolo del tasso di disoccupazione".
  • Fluttuazioni stagionali. Alcuni valori tendono ad aumentare o diminuire a seconda di determinati periodi di tempo, questo può essere un giorno della settimana o un mese dell'anno. Considera l'esempio delle vendite al dettaglio, che spesso raggiungono il picco durante il periodo natalizio. Nel caso della disoccupazione, vediamo un andamento stagionale con il massimo a gennaio e luglio e il minimo a maggio e ottobre, come mostra la Figura 2.
  • Rumore. Alcuni modelli di previsione includono una quarta caratteristica, rumore o errore, che si riferisce a fluttuazioni casuali e movimenti irregolari nei dati. Non considereremo il rumore qui.

Pertanto, identificando la tendenza, sovrapponendo la linea di tendenza alla linea di base e identificando la componente stagionale che può verificarsi durante l'analisi dei dati, si dispone di un modello di previsione che è possibile utilizzare per prevedere i valori:

Valore previsto \u003d Baseline + Trend + Componente stagionale

Definizione di baseline e trend

L'unico modo per determinare la linea di base e la tendenza è utilizzare il metodo di regressione. La parola "regressione" qui si riferisce alla considerazione della relazione tra le variabili. In questo caso esiste una relazione tra la variabile indipendente del tempo e la variabile dipendente del numero di disoccupati. Si noti che la variabile esplicativa a volte è chiamata predittore.

Utilizzare uno strumento come Microsoft Excel per applicare il metodo di regressione. Ad esempio, è possibile eseguire un conteggio automatico in Excel e aggiungere una linea di tendenza a un grafico di serie temporali utilizzando il menu Linea di tendenza nella scheda Layout strumenti grafico o la scheda Layout strumenti grafico pivot nel riquadro Excel 2010 o Excel 2007. Nella Figura 1, I aggiunta una linea di tendenza diritta selezionando la modalità Linea di tendenza lineare nel menu Linea di tendenza. Quindi ho selezionato Altre opzioni della linea di tendenza dal menu Linea di tendenza, quindi le opzioni Visualizza equazione sul grafico e Visualizza valore R quadrato nelle opzioni del grafico, vedere la Figura 3.

Figura 3: Opzioni di tendenza in Excel

Questo processo di adattamento di una linea di tendenza ai dati accumulati è chiamato regressione lineare. Come possiamo vedere nella Figura 1, la linea di tendenza viene calcolata in base all'equazione, dove sono determinati il \u200b\u200blivello di base (8248,8) e il trend (104,67x):

y \u003d 104,67x + 8248,8

Puoi pensare a una linea di tendenza come una serie di coordinate dell'asse x-y correlate in cui puoi includere un periodo di tempo (cioè l'asse x) per ottenere un valore (asse y). Excel determina la linea di tendenza "migliore" utilizzando il metodo dei minimi quadrati (definito come R² nella Figura 1). Una linea dei minimi quadrati è una linea che riduce al minimo la distanza verticale quadrata da ogni punto sulla linea di tendenza al punto corrispondente sulla linea. I valori RMS consentono di determinare che le deviazioni sopra o sotto la linea effettiva non si bilanciano a vicenda. Nella Figura 1, vediamo che R² \u003d 0,5039, il che significa che la relazione lineare spiega il 50,39% della variazione nel tempo delle statistiche sulla disoccupazione.

Trovare una linea di tendenza accurata in Excel spesso comporta tentativi ed errori, insieme a un'ispezione visiva. Nella Figura 1, una linea di tendenza diritta non è la soluzione migliore. Excel offre altre opzioni di linea di tendenza che vedete nella Figura 3. Nella Figura 4, ho aggiunto una linea della media mobile a quattro periodi basata sulla media aritmetica dei periodi delle serie temporali correnti e più recenti.

Inoltre, ho aggiunto una linea di tendenza polinomiale applicando un'equazione algebrica per tracciare la linea. Si noti che la linea di tendenza polinomiale ha un valore R² di 0,9318, che indica la migliore relazione in termini di relazione tra le variabili indipendenti e dipendenti. Tuttavia, un valore R² più elevato non significa necessariamente che la linea di tendenza fornirà una qualità predittiva. Esistono altri metodi per fare previsioni accurate, che descriverò brevemente di seguito. Alcune varianti della linea di tendenza in Excel (ad esempio, linea di tendenza lineare, polinomiale) consentono di fare previsioni in avanti e anche in direzione opposta, tenendo conto del numero di periodi, con il tracciamento dei valori ottenuti sul grafico. Ad alcuni, l'espressione "previsione nella direzione opposta" può sembrare strana. Questo è meglio illustrato con un esempio. Supponiamo che un nuovo fattore - un rapido aumento dei posti di lavoro nel settore pubblico (ad esempio, lavori per la difesa della patria all'inizio degli anni 2000, dipendenti temporanei dell'US Census Bureau) - abbia rilasciato un rapido calo della disoccupazione. È necessario prevedere il tasso di crescita del settore dei nuovi posti di lavoro nella direzione opposta per diversi mesi, quindi ricalcolare il tasso di disoccupazione per arrivare a una misura uniforme del cambiamento.

È inoltre possibile applicare manualmente l'equazione della linea di tendenza per calcolare i valori per la prospettiva. Nella Figura 5, ho aggiunto una linea di tendenza polinomiale di previsione a 6 mesi rimuovendo prima i dati per gli ultimi 6 mesi (ovvero, da aprile a settembre 2012) dalla serie temporale originale.

Se confronti la schermata 5 con la schermata 1, noterai che le previsioni polinomiali hanno una tendenza al rialzo, che non corrisponde alla tendenza al ribasso (tendenza) delle serie storiche effettive.

Ci sono due punti importanti da fare sulla regressione.

  • Come accennato in precedenza, la regressione lineare include una variabile indipendente e una dipendente. Per capire come variabili esplicative aggiuntive possono spiegare i cambiamenti nella variabile dipendente, prova a costruire un modello di regressione multipla. Nel contesto della previsione del numero di disoccupati negli Stati Uniti, è possibile aumentare R² (e accuratezza delle previsioni) considerando il tasso di crescita dell'economia, la popolazione statunitense e la crescita del numero di lavoratori occupati. SSAS può adattare molte variabili (cioè regressori) in un modello di previsione delle serie temporali.
  • Gli algoritmi di previsione delle serie temporali, inclusi quelli utilizzati in SSAS, possono calcolare l'autocorrelazione, che è la correlazione tra i valori delle serie temporali adiacenti. Un modello di previsione che include direttamente l'autocorrelazione è chiamato modello autoregressivo (AR). Ad esempio, un modello di regressione lineare costruisce un'equazione di tendenza basata su un periodo (ad esempio, 104,67 * x), mentre un modello AR costruisce un'equazione basata sui valori precedenti (ad esempio, -0,417 * disoccupati (-1) + 0,549 * impiegato (-uno)). Il modello AR aumenta potenzialmente l'accuratezza delle previsioni poiché prende in considerazione informazioni aggiuntive al di sopra della tendenza e della componente stagionale.

Prendiamo in considerazione la componente stagionale

La componente stagionale nella struttura di una serie temporale di solito si manifesta in relazione al giorno della settimana, al giorno del mese o al mese dell'anno. Come notato sopra, il numero di disoccupati negli Stati Uniti di solito aumenta e diminuisce in un dato anno solare. Ciò è vero anche se l'economia cresce, come mostra la Figura 2. In altre parole, per fare una previsione accurata, è necessario tenere conto della componente stagionale. Un approccio comune consiste nell'applicare il livellamento della stagionalità. In Practical Time Series Forecasting: A Hands-On Guide, Second Edition (CreateSpace Independent Publishing Platform, 2012), l'autore Galit Shmuely consiglia di utilizzare uno dei tre metodi seguenti:

  • calcolare una media mobile;
  • analisi delle serie temporali a un livello meno dettagliato (ad esempio, considerare le variazioni del numero di disoccupati per trimestre, piuttosto che per mese);
  • analisi delle singole serie storiche (e calcolo delle previsioni) per stagione.

La linea di base e la tendenza vengono determinate durante il calcolo della previsione sulla base di una serie temporale uniforme. Facoltativamente, la componente stagionale o l'aggiustamento può essere riapplicato ai valori di previsione in base ai valori iniziali dei fattori stagionali quando si utilizza il metodo Holt-Winters. Se vuoi vedere come viene calcolata la stagionalità in Excel, cerca nel web "Metodo Winters in Excel". Inoltre, per una spiegazione esauriente del metodo Holt-Winters, vedere Wayne L. Winston Microsoft Office Excel 2007: analisi dei dati e modellazione aziendale, seconda edizione (Microsoft Press, 2007).

In molti pacchetti di data mining, come SSAS, gli algoritmi di previsione delle serie temporali tengono conto automaticamente delle variazioni stagionali misurando le relazioni stagionali e incorporandole nel modello di previsione. Tuttavia, potresti voler impostare suggerimenti sul modello dei cambiamenti stagionali.

Precisione della misurazione del modello di previsione

Come discusso in precedenza, il modello originale (utilizzando il metodo dei minimi quadrati) non fornisce necessariamente l'accuratezza della previsione. Il modo migliore per testare l'accuratezza delle stime predittive è suddividere le serie temporali in due set di dati, uno per la creazione (ovvero l'addestramento) del modello e l'altro per la convalida. Il set di dati di convalida sarà la parte più recente del set di dati non elaborato e idealmente coprirà un periodo di tempo uguale alla linea temporale prevista per il futuro. Per controllare (convalidare) il modello, i valori previsti vengono confrontati con i valori effettivi. Si noti che dopo aver convalidato il modello, il modello può essere ricostruito utilizzando l'intera serie temporale, quindi è consigliabile utilizzare i valori effettivi più recenti per prevedere i valori futuri delle metriche.

Quando si misura l'accuratezza di un modello predittivo, in genere sorgono due domande: come determinare l'accuratezza della stima predittiva e quanti dati storici utilizzare per addestrare il modello.

Come determinare l'accuratezza della stima della previsione? In alcuni scenari, i valori previsti superiori ai valori effettivi potrebbero non essere desiderabili (ad esempio, nelle proiezioni di investimento). In altre situazioni, i valori previsti al di sotto dei valori effettivi possono avere conseguenze devastanti (ad esempio, prevedere il prezzo di offerta vincente più basso per un articolo all'asta). Ma nei casi in cui si desidera calcolare un punteggio per tutte le previsioni (non importa se i valori previsti sono superiori o inferiori ai valori reali), è possibile iniziare con un errore quantitativo in una previsione separata utilizzando la definizione:

errore \u003d valore previsto - valore effettivo

Con questa definizione di errore, ci sono due metodi popolari per misurare l'accuratezza: l'errore assoluto medio (MAE) e l'errore percentuale assoluto medio (MAPE). Nel metodo MAE, i valori assoluti degli errori di previsione vengono sommati e quindi divisi per il numero totale di previsioni. Il metodo MAPE calcola la deviazione assoluta media dalla previsione in percentuale. Per esempi di utilizzo di questi e altri metodi per misurare la qualità delle stime predittive, un modello Excel (con dati predittivi di esempio e fattori di accuratezza), consultare la pagina Web del modello di diagnostica delle metriche della domanda (demandplanning.net/DemandMetricsExcelTemp.htm).

Quanti dati storici dovrebbero essere usati per addestrare il modello? Quando si lavora con una serie temporale con una lunga cronologia, è possibile includere tutti i dati storici nel modello. Tuttavia, a volte la cronologia aggiuntiva non migliora l'accuratezza della previsione. I dati storici possono persino distorcere la previsione se le condizioni del passato differiscono in modo significativo dalle condizioni del presente (ad esempio, la composizione della forza lavoro è diversa ora e in passato). Non ho trovato nessuna formula particolare o metodo pratico che suggerisca quanti dati storici includere, quindi suggerisco di iniziare con una serie temporale che è molte volte più grande degli intervalli di tempo della previsione e quindi di verificarne l'accuratezza. Quindi, prova ad arrotondare il numero della cronologia per eccesso o per difetto e riesegui il test.

Previsione di serie temporali in SSAS

Le previsioni di serie temporali sono apparse per la prima volta in SSAS nel 2005. Per calcolare i valori previsti, l'algoritmo Microsoft Time Series ha utilizzato un algoritmo unificato chiamato albero autoregressivo con previsione incrociata (ARTXP) o albero autoregressivo con previsione incrociata. ARTXP combina un metodo autoregressivo con un albero decisionale di data mining in modo che l'equazione di previsione possa cambiare (ovvero divisione) in base a determinati criteri. Ad esempio, un modello di previsione fornirà un migliore adattamento (e una migliore accuratezza della previsione) se si partiziona prima per data e poi in base al valore della variabile esplicativa, come mostra la Figura 6.


Figura 6: esempio di albero decisionale ARTXP in SSAS

In SSAS 2008, l'algoritmo Microsoft Time Series, oltre ad ARTXP, ha iniziato a utilizzare un algoritmo chiamato media mobile integrata autoregressiva (ARIMA), una media mobile integrata con autoregressivo, per calcolare previsioni a lungo termine. ARIMA è considerato lo standard del settore e può essere visto come una combinazione di processi autoregressivi e modelli di media mobile. Inoltre, analizza gli errori di previsione storica per migliorare il modello.

Per impostazione predefinita, l'algoritmo Microsoft Time Series combina i risultati degli algoritmi ARIMA e ARTXP per ottenere previsioni ottimali. Se lo desideri, puoi annullare questa funzione. Diamo un'occhiata alla documentazione della documentazione in linea di SQL Server (BOL):

“L'algoritmo addestra due diversi modelli degli stessi dati: un modello utilizza l'algoritmo ARTXP e l'altro utilizza l'algoritmo ARIMA. L'algoritmo combina quindi i risultati dei due modelli per sviluppare la migliore previsione che copre un numero variabile di intervalli di tempo. Poiché l'algoritmo ARTXP è più adatto per previsioni a breve termine, è consigliabile utilizzarlo all'inizio di una serie di previsioni. Tuttavia, se gli intervalli di tempo necessari per la previsione vanno nel futuro, ARIMA è più significativo ".

Quando lavori con la previsione delle serie temporali in SSAS, tieni presente quanto segue:

  • Sebbene SSAS disponga di una scheda Grafico precisione di data mining, non funziona con il data mining per i modelli di serie temporali. Di conseguenza, è necessario misurare manualmente l'accuratezza utilizzando uno dei metodi qui menzionati (ad esempio MAE, MAPE) utilizzando uno strumento come Excel per i calcoli.
  • SSAS Enterprise Edition consente di suddividere una singola serie temporale in molti "modelli storici" in modo da non dover dividere manualmente i dati in set di dati per l'addestramento e la convalida del modello per verificare l'accuratezza della previsione. Dal punto di vista dell'utente finale, esiste un solo modello di serie temporale, ma è possibile confrontare i risultati effettivi con i risultati previsti all'interno del modello, come mostra la Figura 7. dati.

Passo successivo

In questo articolo, ti ho presentato le basi della previsione delle serie temporali. Abbiamo anche coperto alcuni dettagli degli algoritmi sottostanti in modo che non interferiscano con l'elaborazione delle serie temporali. Come passaggio successivo, ti suggerisco di padroneggiare gli strumenti di previsione delle serie temporali con SSAS. Un esempio potrebbe essere un progetto che utilizza i dati sulla disoccupazione forniti in questo articolo. È quindi possibile visualizzare l'esercitazione intermedia sul data mining (Analysis Services - Data mining) in linea TechNet all'indirizzo technet.microsoft.com/en-us/library /cc879271.aspx.

Perché il data mining è così impopolare

Le tecnologie di business intelligence (BI) come OLAP sono state ampiamente utilizzate negli ultimi dieci anni. Allo stesso tempo, Microsoft ha iniziato a promuovere un'altra tecnologia BI, il data mining, in strumenti popolari come Microsoft SQL Server e Microsoft Excel. Tuttavia, la tecnologia di data mining non ha ancora preso l'iniziativa. Perché? Mentre la maggior parte delle persone può comprendere rapidamente i concetti fondamentali del data mining, i dettagli di base degli algoritmi sono inestricabilmente legati a concetti e formule matematiche. C'è una grande "discrepanza" tra un alto livello di comprensione astratta e un'esecuzione dettagliata. Di conseguenza, il data mining è visto come una scatola nera dai professionisti IT e dai clienti industriali, il che non favorisce l'adozione diffusa della tecnologia. Questo articolo è il mio tentativo di ridurre la "discrepanza" nella previsione delle serie temporali.

Calcolo del tasso di disoccupazione

Nell'articolo principale, i dati per i grafici si basano su informazioni sulla popolazione attiva pubblicate dagli Stati Uniti. Bureau of Labor Statistics (http://www.bls.gov/). BLS pubblica i dati sulla disoccupazione sulla base di un sondaggio mensile condotto dall'US Census Bureau (BLS) che estrapola il numero totale di occupati e disoccupati. In particolare, BLS applica la formula:

Tasso di disoccupazione \u003d disoccupato / (disoccupato + occupato)

È interessante notare che quando si parla del tasso di disoccupazione, i media citano solitamente un coefficiente di stagionalità equalizzato. La regolazione stagionale viene eseguita utilizzando un modello generale chiamato media mobile integrata autoregressiva (ARIMA). Si tratta essenzialmente dello stesso algoritmo utilizzato in molti pacchetti di data mining per la previsione di serie temporali, incluso SQL Server Analysis Services (SSAS). Per ulteriori informazioni sul modello ARIMA utilizzato da BLS, visitare la pagina Web del programma di regolazione stagionale X-12-ARIMA (www.census.gov/srd/www/x12a/). Si noti che nella progettazione tipica di questo articolo, ho utilizzato valori aggiustati stagionali e non stagionali.


Padroneggiare la previsione delle serie temporali


articoli Correlati