License
Novel Bayesian model combination schemes with model uncertainty: An application to prices of selected energy commodities
Abstract (PL)
Celem niniejszej rozprawy jest zastosowanie wybranych Bayesowskich metod kombinowania prognoz do prognozowania cen wybranych surowców energetycznych. Metody te posiadają następujące zalety. Po pierwsze estymacja następuje w sposób rekurencyjny, tzn. w chwili t prognoza formułowana jest jedynie w oparciu o dane dostępne w okresie t -1, co oddaje rzeczywistą sytuację, na przykład inwestora na rynku. Po drugie, zarówno współczynniki regresji wielorakiej w pojedynczych, poddawanych kombinowaniu, modelach regresji wielorakiej, jak i przypisywane im wagi są zmienne w czasie. Pozwala to „wychwycić” zmieniające się na rynku relacje między zmienną objaśnianą a zmiennymi objaśniającymi, jak również samą zmieniającą się czasie przydatność do prognozowania różnych zmiennych objaśniających w różnych okresach czasu. Wreszcie, metody te pozwalają na analizę regresji z tzw. problemem „duże p, małe n”, tzn. dopuszczają sytuację, gdy liczba zmiennych objaśniających w modelu regresji wielorakiej jest relatywnie duża w porównaniu z długością szeregów czasowych reprezentujących te zmienne (liczbą obserwacji). W większości przypadków analizie poddano dane o częstotliwości miesięcznej pomiędzy 1986 a 2016 rokiem. Zakres czasowy badania podyktowany był dostępnością danych. Natomiast częstotliwość była kompromisem między wyeliminowaniem krótkotrwałych spekulacyjnych wahań rynkowych, koniecznością uzyskania odpowiednio długich szeregów czasowych oraz możliwością uwzględnienia zarówno indeksów makroekonomicznych jak i tych z rynków finansowych. Rozprawa składa się z czterech opublikowanych artykułów naukowych. W pierwszym artykule tzw. Dynamic Model Averaging (DMA) i Dynamic Model Selection (DMS) zostały zastosowane do analizy cen ropy naftowej. W drugim artykule pogłębiono analizę cen ropy naftowej przy pomocy metody DMA, w oparciu o uzyskane w pierwszym artykule wyniki. W artykule trzecim zastosowano DMA, DMS oraz tzw. Median Probability Model (MED) do analizy cen ropy naftowej, gazu ziemnego i węgla kamiennego. Wyniki porównano z nie-Bayesowską metodą uśredniania opartą o kryterium Akaike’a. Jak również wykorzystano, jako pomocnicze, dane dotyczące zapytań z wyszukiwarki Google, poprzez nieznaczną modyfikację wybranych metod kombinowania prognoz. W artykule czwartym analizie poddano 69 różnych surowców i skonkludowano, że w większości przypadków Bayesowskie metody kombinowania prognoz pozwalają osiągnąć statystycznie istotnie bardziej dokładne prognozy (test Diebolda-Mariano) aniżeli, na przykład, tzw. metoda naiwna, czy modele ARIMA. Z ostatniego artykułu wynika także, że samo dopuszczenie zmiennych w czasie współczynników w regresji wielorakiej nie prowadzi do takiej poprawy otrzymanych prognoz, jak kombinowanie dużej liczby pojedynczych modeli. We wszystkich pracach analizowane były tzw. ceny spot.
Abstract (EN)
The aim of this dissertation is to apply the selected Bayesian model combination schemes in case of forecasting the prices of the selected energy commodities. These methods have the following advantages. First, the estimation is done in a recursive way, i.e., the forecast in time t is formulated only on the basis of the data available during time t -1, which corresponds with the real-life situation, of, for example, an investor on the market. Secondly, the coefficients of a multilinear individual, i.e., being put into the model combination scheme, regression model, as well as, the weights ascribed to each of these individual models, are time-varying. These features allow to “grasp” the changing relationships between the explained variable and the explanatory variables, as well as, the time-varying usefulness in forecasting of various explanatory variables in different time periods. Finally, these methods allow to analyse regressions with „large p, small n”, i.e., they allow for the number of explanatory variables in a multilinear regression model to be relatively large comparing with the length of time-series representing these explanatory variables (the number of observations). In most of the cases the analysis was done over monthly data from the period between 1986 and 2016. The time period was chosen due to the data availability. On the other hand, the frequency of the data was a compromise between eliminating short-term speculative market fluctuations, necessity to obtain long enough time-series and ability to include both macroeconomic and financial market indices. The dissertation consists of four published scientific papers. In the first article Dynamic Model Averaging (DMA) and Dynamic Model Selection (DMS) were used to analyse crude oil prices. In the second article, the analysis of crude oil prices with DMA was extended, basing on the results obtained in the first paper. In the third article DMA, DMS and Median Probability Model (MED) were used to analyse crude oil, natural gas and coal prices. The results were compared with a non-Bayesian method of model averaging, based on the Akaike criterion. Moreover, the data about Internet queries from the Google search website were used as the additional one. These was done by a small modification in the considered model combination schemes framework. The fourth article is focused on the analysis of 69 various commodities. It was concluded that in most of the cases the Bayesian model combination schemes allow to obtain statistically significantly more accurate forecasts (the Diebold-Mariano test) than, for example, the naive method or ARIMA models. This last article concludes also that solely time-varying coefficients in a multilinear regression model does not lead to such an improvement in forecast accuracy as combining a large number of individual models. In all articles the spot prices were analysed.